欢乐捕鱼技巧打法
你好,游客 登錄
背景:
閱讀新聞

數據湖對初創公司分析工作至關重要的五個原因

[日期:2019-03-28] 來源:企業網D1Net  作者: [字體: ]

  與更成熟的公司相比,早期的初創公司有著截然不同的分析需求。數據湖基礎設施可以使工作變得更容易。

  你可能對“數據湖”這個術語并不熟悉,但如果你在早期階段的初創公司中,你可能很快就會熟悉。

  雖然數據倉庫和數據集市往往迫使企業進入狹隘的數據范式和孤島,但數據湖則側重了更全面和更廣泛的分析視角。數據湖為分析數據提供了更具適應性的方法,并強調所有信息的價值,而不是被預先篩選的零散信息。

  在大數據行業圍繞數據湖的爭議往往集中在他們認為的缺點上。數據湖沒有結構化、太寬泛和太難管理。無論如何,數據湖具備了使其有獨特價值的關鍵特征,盡管這些特征相對較新,但對初創公司尤其有用。

大數據

  這是因為對于初創公司而言,丟棄他們所擁有的大量數據可能會導致對市場的了解更少,并可能忽略一些關鍵趨勢。這五個原因凸顯了為什么數據湖是初創公司分析范式的重要組成部分,而不是將自己鎖定在嚴格的數據管理實踐中。

  數據湖將與規模相關的成本保持在較低水平

  初創公司開始可能會有較少的數據流和較小的需求,但是當它們開始發展時,這種情況會迅速改變。數據倉庫是高度結構的,需要由專業的數據工程師和架構師進行高程度的維護和持續監控。其中包括構建適當的模式以進行分析,更改分析模型,甚至構建正確的結構來存儲清理數據。

  例如,Meta Networks等公司為企業提供“網絡即服務”(Network-as-a-Service)工具,每秒可收集數百萬個數據點,隨著新客戶的加入,數據量呈指數級增長。通過使用Upsolver平臺(它可以依賴于更容易擴展的系統,例如AWS的S3云服務器)來構建數據湖,該公司已經能夠收集所需的所有數據,而無需預先構建模式和倉庫結構。

  數據湖消除了數據孤島

  在一家新成立的公司,快速共享數據和執行各種橫向分析可以提供洞察力以及新的、意想不到的前進道路。然而,許多早期初創公司為了方便而錯誤地創建了數據孤島。信息嚴重地被分割開,通信和傳輸數據變得更加困難。

  在企業層面,普華永道公司在加州大學歐文分校醫療中心(UC Irvine Medical Center)實施了一個數據湖系統,這極大改善了運營工作。與初創公司相比,醫療機構甚至可能更容易出現數據孤島,但普華永道公司表示,數據湖可以提供更敏捷的方法。由于數據沒有被強制劃分為不同模式,該醫院已經能夠提供更好的分析、更廣泛的研究和更快的溝通。

  數據湖減少了排序和查詢的時間

  無論初創公司選擇何種數據結構,他們都必須投入一些資源來管理和優化。通常,這意味著花費數小時來設置儀表板、分析算法和數據模式,并要始終對所有這些工作進行管理。這意味著要配備一名全職工作人員,如果他不是專職于這項工作,則他就會放棄其他工作任務來花時間處理數據倉庫工作。

  由于數據湖具有非結構化特性和原始數據流,因此需要維護的工作量要少得多。與需要配備一名全職人員不同(這是大多數初創公司根本無法負擔的),數據湖可以讓任何團隊成員自己執行臨時性的分析,而無需預先進行復雜的清理和結構化過程。重要的是,它還可以顯著縮短查詢時間。

  數據湖包含所有數據

  大數據的關鍵是盡可能多地提供信息來解析和處理,但大多數數據倉庫都與這種范式背道而馳。數據倉庫通常會過濾掉不符合預定結構的重要數據塊,通常會刪除掉一些數據點,而這些數據點在不同視角下觀察時可能包含關鍵見解。數據湖提供的價值的源泉之一是,它龐大的數據存儲庫有不同來源,并提供了獨特的方法來進行組合。這種上下文無關的模型在執行預測分析或只是尋找一些所關注的趨勢時很有價值。

  EMC是很受歡迎的數據湖解決方案之一,已成功應用于醫療服務領域,以改善預測性護理和趨勢發現。然而,其如此成功,是因為它可以在不同的配置下研究更廣泛的橫向數據。與數據倉庫(將預定分析算法強加于數據)不同,數據湖擁有全套原始數據,這使初創公司能夠根據需求而非技術來執行自己的分析。

  數據湖讓初創公司通過分析獲得創意

  重要的是,數據湖可能并不會將企業鎖定在分析和見解的特定范式中。數據倉庫通常具有重要的用途,但由于其固定性結構,使其應用范圍較窄。因為數據倉庫需要仔細規劃數據流和結構,所以初創公司必須在看到數據之前就決定它的使用方式。

  對于一家了解其數據和渠道的公司而言,建立限制性習慣最終可能會對分析大局產生不利影響。另一方面,數據湖能夠忽略有關數據的先入之見,同時能夠以獨特方式探索信息。

  數據湖有利于工作取得成功

  對于通常以顛覆和創新而自豪的初創公司而言,擁有一個數據的整體觀以及擁有基于需求而非限制來執行臨時分析的能力,這是一個至關重要的區別。

 

  您的初創公司根本無法準確預測在組織生命周期中很重要的一些特定而有限的指標、信息源和用例。通過利用數據湖基礎設施,您的公司及其利益相關者可以重新審視這些決策,并在未來幾年開啟新的價值層面。





收藏 推薦 打印 | 錄入:Cstor | 閱讀:
相關新聞       數據湖 
本文評論   查看全部評論 (0)
表情: 表情 姓名: 字數
點評:
       
評論聲明
  • 尊重網上道德,遵守中華人民共和國的各項有關法律法規
  • 承擔一切因您的行為而直接或間接導致的民事或刑事法律責任
  • 本站管理人員有權保留或刪除其管轄留言中的任意內容
  • 本站有權在網站內轉載或引用您的評論
  • 參與本評論即表明您已經閱讀并接受上述條款
欢乐捕鱼技巧打法 极速6合规律 时时彩大底 pk10稳赚技巧数据多高 吉林快三稳赚技巧 新时时历史360 闲1庄0.95刷反水怎么刷龙虎 APP自助领取彩金38 幸运飞艇1—7雪球计划软件 时时彩万能6码运用 快速时时计划