Auto Byte

專注未來出行及智能汽車科技

微信掃一掃獲取更多資訊

Science AI

關注人工智能與其他前沿技術、基礎學科的交叉研究與融合發展

微信掃一掃獲取更多資訊

大數據+機器學習融合,亞馬遜云科技全新服務組合上線

一家公司轉型成為數據驅動型,收入會增加20%,同時成本會減少30%。

機器學習技術崛起后,人們津津樂道的是神經網絡結構、網絡層數、超參數的優化等概念,但數據的采集、處理、優化對于算法能力同樣至關重要。

4 月 27 日,在北京舉行的活動中,亞馬遜云科技宣布推出「云、數、智三位一體」的大數據與機器學習融合服務組合,幫助企業推進大數據和機器學習的融合,將機器學習由實驗轉為規?;涞貙嵺`。

亞馬遜云科技提出的服務組合涵蓋三個方面,分別是:構建云中統一的數據治理底座,為機器學習提供生產級別的數據處理能力,以及賦能給業務人員更加智能的數據分析工具。

該服務組合是亞馬遜云科技自去年推出「智能湖倉」架構以來,持續推進該框架的深度智能并加速其落地實踐。

亞馬遜云科技大中華區產品部總經理陳曉建表示:「隨著企業數據越來越多,機器學習模型越來越先進,很多企業期望通過大數據與機器學習技術的融合,進一步帶動業務創新,提升產出。但企業往往面臨一個困境,有大量的數據和分析技術儲備,也嘗試了很多先進的機器學習模型,但就是很難有實際的業務產出?!?/p>

亞馬遜云科技認為,企業不能只靠機器學習,而應在云中打造統一的數據基礎底座,實現大數據與機器學習的合力。在大數據與機器學習領域,亞馬遜云科技提供廣泛而深入的服務,既打通兩個領域的數據治理底層服務,還能實現大數據與機器學習之間的相互賦能。

「云、數、智三位一體」的大數據和機器學習融合服務組合,是智能湖倉架構的重要組成。亞馬遜云科技通過在云中構建統一的數據治理底座,提供數據分析服務保障機器學習的生產實踐,實現機器學習反向賦能智能化數據分析,促進云、數、智三者的統一與融合,幫助客戶推進機器學習項目的落地。

•    構建云中統一的數據治理底座,打破數據及技能孤島。亞馬遜云科技能幫助客戶構建統一的數據治理底座,實現大數據和機器學習的數據共享,數據權限的統一管控,以及兩者統一的開發和流程編排。這不僅能提升大數據和機器學習的高效融合,還能減少大數據和機器學習重復構建的工作,并且顯著降低成本。其中, Amazon Lake Formation 推出諸多新功能,實現了數據網格跨部門的數據資產共享,以及基于單元格的最細粒度的權限控制機制。Amazon SageMaker Studio 可一站式地完成數據開發、模型開發及相關的生產任務,該服務基于多種專門構建的服務,如交互式查詢服務 Amazon Athena、云上大數據平臺 Amazon Elastic MapReduce (Amazon EMR)、云數據倉庫服務 Amazon Redshift、Amazon SageMaker 等,為大數據和機器學習提供統一的開發平臺。

•    助力機器學習由實驗轉為實踐,為機器學習提供生產級別的數據處理能力。機器學習項目成功的關鍵是對復雜的數據進行加工和準備。亞馬遜云科技提供多種靈活可擴展、專門構建的大數據服務,幫助客戶進行復雜的數據加工及處理,應對數據規模的動態變化,優化數據質量。其中,Amazon Athena 能夠對支持多種開源框架的大數據平臺,包括 Amazon EMR、高性能關系數據庫 Amazon Aurora、NoSQL 數據庫服務 Amazon DynamoDB、Amazon Redshift 等多種數據源,對這些數據源進行聯邦查詢,快速完成機器學習建模的數據加工。 以 Amazon Redshift、Amazon Managed Streaming for Apache Kafka (Amazon MSK)和 Amazon EMR 為代表的無服務器分析能力,可以讓客戶無需配置、擴展或管理底層基礎設施,即可輕松地處理任何規模的數據,為機器學習項目提供兼具性能和成本效益的特征數據準備。

•    讓數據分析智能化,賦能業務人員探索創新。亞馬遜云科技還不斷提供更加智能的數據分析服務,賦能業務人員進行智能分析、模型效果驗證以及自主式創新。例如,在日常分析工具中集成機器學習模型預測能力,其中深度集成機器學習 Amazon SageMaker 模型預測能力的 Amazon QuickSight 、在分析結果中添加基于模型預測的 Amazon Athena ML,可幫助用戶使用熟悉的技術,甚至通過自然語言來使用機器學習。亞馬遜云科技還提供如 Amazon Redshift ML、可視數據準備工具 Amazon Glue Databrew、零代碼化的機器學習模型工具 Amazon SageMaker Canvas 等服務,讓業務人員探索機器學習建模。

目前,全球數十萬客戶正借助亞馬遜云科技大數據及機器學習服務開展業務創新,將機器學習投入實踐,解決現實世界中真實和復雜的數據應用場景。

在亞馬遜已提供的「數據湖倉」等能力之上,不同團隊有不同的應用方式?!冈谝恍┢髽I中,機器學習能力完全誕生于大數據團隊,他們最喜歡的亞馬遜云科技產品是 Amazon EMR?!箒嗰R遜云科技大中華區產品部技術專家團隊總監王曉野表示。

Amazon EMR 能夠提供與開源框架完全兼容的技術能力,其中的 Spark ML Lib 等框架在機器學習領域已被廣泛用于技術實現。Amazon EMR 通過靈活擴展能力,及在云端采用 Amazon Graviton 2 自研芯片的創新能力,在帶給企業完全開源兼容性的同時,大幅實現了性能和成本的提升。

第二類企業的數智化起步是由深度學習帶來的,如應用機器視覺、語音識別等能力。在這樣場景下,應用「智能湖倉」產品更多是面向數據科學的 Amazon SageMaker,其提供的從數據標記、內置算法,再到高效模型訓練能力,可以在生產環境中靈活彈性實現模型部署,實現端到端的機器學習。

在活動中,一些亞馬遜云科技的客戶進行了業務落地分享。

樂我無限(Joyme)運營的全球化直播平臺 LiveMe,薈萃了來自 200 多個國家和地區的近 100 萬名主播,每月活躍用戶數(MAU)超過 3700 萬。LiveMe 基于亞馬遜云科技的解決方案搭建了數據研發中心平臺的核心技術服務。Joyme 數據研發中心總監楊飛表示:「LiveMe 核心業務均部署在亞馬遜云科技上,通過亞馬遜云科技的技術賦能,實現了降本增效,加速了業務創新。通過直播內容實時識別技術服務,LiveMe 不僅提升了用戶體驗,還大量降低了內容管理的業務成本。通過欺詐交易識別技術服務輔助識別欺詐交易,減少欺詐、拒付類交易,LiveMe 每年減少經濟損失可達數百萬美元。未來 LiveMe 將在系統穩定性、數據驅動以及新技術開發等方面加深與亞馬遜云科技的合作?!?/p>

亞馬遜云科技構建了強大的合作伙伴網絡,通過合作伙伴網絡成員幫助客戶構建解決方案。亞馬遜云科技合作伙伴上海欣兆陽(Convertlab)以云計算、大數據和人工智能為代表的數字化技術,為企業營銷提供數字化、自動化、智能化基礎設施以及相關的專業服務。

Convertlab 聯合創始人兼 CTO 李征表示:「基于亞馬遜云科技統一的數據基礎底座, Convertlab 構建了相輔相成的一體化數據智能湖倉架構 Data Hub 和一體化高效機器學習平臺 AI Hub,使數據流轉時效性提升 32%,可進行快速的特征設計與機器學習模型迭代,模型上線效率提升 30%。當前已上線 5 大營銷特征類別,300 多營銷特征,20 多營銷 AI 模型,更好地賦能客戶智慧營銷,實現業務增長,助推行業數字化轉型?!?/p>

此外,亞馬遜云科技還通過數據科學實驗室、機器學習實驗室和機器學習專業服務等一系列定制化措施,從基礎能力構建到行業前沿知識分享,幫助客戶將 “數據驅動轉型” 從設想到全面落地,重塑創新引擎。

市場研究機構 IDC 提供的報告顯示,到 2023 年全球企業在 AI 系統方面的支出將達到 979 億美元,比 2019 年增加 2.5 倍。而 Gartner 的分析則指出,到 2024 年將有 75% 的企業將把機器學習技術真正用于生產,為業務所賦能。

機器學習和大數據融合對企業業務將會產生越來越大的作用。

產業Amazon SageMaker云服務AWS
暫無評論
暫無評論~
塔城颂嫌租售有限公司 上海千岁会展有限公司| 底阀有限公司| 柴油机有限公司| 打标机有限公司| 山东智展有限公司| 上海枫郡建材有限公司| 上海北林电子技术有限公司| 金属切削机床有限公司| 瑞丰汽摩配件有限公司| 佛山格雷米奥科技有限公司| 834 423 521 529 557