去年以來,生成式 AI 技術的發展備受關注。在其中,OpenAI 的 ChatGPT 模型被視為自然語言處理領域的一個重要里程碑。ChatGPT 模型在各種應用場景中廣泛應用,并激發了各大科技公司的競爭熱情。
4 月 13 日,一直以來在 AIGC 圈內相對低調的亞馬遜云科技突然加入生成式 AI 競賽。與大多數服務于 C 端用戶或在熱點期發布 AIGC 產品的科技公司不同,亞馬遜云科技作為一家擁有豐富企業服務經驗的云計算服務提供商,結合多年對企業需求的觀察,打出了一套組合拳。利用自身在云資源、云計算、機器學習技術研發等多個領域的優勢,推出了多款優秀的服務:
推出 Amazon Bedrock 服務和 Amazon Titan 大語言模型,以幫助云企業提高效率和創新能力;
提供兩款專門針對生成式 AI 優化的高性價比虛擬機實例 EC2 Trn1n 和 EC2 Inf2,這兩款實例基于自研 AI 訓練 (Trainium) 與推理芯片 (Inferentia),能夠大幅節省企業的生成式 AI 訓練和推理成本;
推出 AI 編碼助手 Amazon CodeWhisperer,面向所有個人用戶免費開放,不設任何資質或使用時長的限制。
這些服務的推出將有助于企業更好地使用生成式 AI 技術,提高其效率和創新能力,同時也進一步推動了 AIGC 領域的發展。
在這樣的背景下,亞馬遜云科技推出了自己的生成式 AI 系列產品,包括 Amazon GPT(一種基于開源 GPT 的自然語言生成模型)、Amazon Image Builder(一種基于 GAN 的圖像生成模型)、Amazon Fiddle(一種用于自動生成 Web UI 前端代碼的模型)等,這些產品都利用了亞馬遜云科技多年來在機器學習領域的技術積累和經驗。
這些產品的特點是高度可定制化,企業可以根據自己的業務需求自定義訓練數據集、訓練算法和超參數,以獲得最適合自己業務場景的模型。同時,這些產品的使用也非常簡單,只需幾個步驟即可完成模型的部署和集成,大大降低了企業使用機器學習技術的門檻和成本。
除此之外,亞馬遜云科技還提供了一系列與生成式 AI 相關的解決方案,如基于 Amazon SageMaker 的自動機器學習和模型管理服務、基于 Amazon Kendra 的企業知識圖譜服務、基于 Amazon Comprehend 的自然語言處理服務等,為企業提供了全方位的機器學習解決方案。
亞馬遜云科技在生成式 AI 領域的發力不僅是在技術上的創新和突破,更是在產品和服務方面的完善和豐富。未來,隨著機器學習技術的不斷發展和應用場景的不斷擴大,亞馬遜云科技將繼續加強自己在機器學習和人工智能領域的領先地位,為企業提供更加優質的技術和服務。
一、意料之中:
亞馬遜云科技基于其在2B市場中的豐富經驗以及機器學習技術的優勢,成功呈現出了一份“漂亮的答卷”。
亞馬遜云科技發布了一系列生成式AI產品,展現了其在機器學習技術方面的實力。作為AIGC領域的佼佼者,ChatGPT等技術引發了新一輪AI技術的關注。機器學習算法可生成文本和圖片等內容,亞馬遜云科技不斷降低機器學習技術使用門檻,提供高性能、可伸縮的基礎設施和具有超高性價比的機器學習訓練和推理。亞馬遜云科技在人工智能和機器學習堆棧的三個層級都投入了眾多技術研發成本,產出了不少重磅的產品組合。該公司擁有超過20年的人工智能和機器學習實踐經驗,并在賦能自有業務與千行百業創新方面做出了很多成績。企業需要能夠直接找到并訪問高性能基礎模型,這些模型需要能夠給出最匹配業務場景的優秀反饋結果。亞馬遜云科技通過與許多企業打交道,發現了企業對于生成式AI的訴求,并為滿足這些需求開發了一系列性能強勁的AI產品。
圖:在亞馬遜云科技平臺上構建生成式 AI
二、與眾不同:
亞馬遜云科技的生成式 AI 主要面向企業
亞馬遜云科技是一家具有豐富企業服務經驗的公司,與其他推出面向大眾的 AIGC 產品不同,亞馬遜云科技此次推出的生成式 AI 產品主要瞄準企業,深入對云基礎設施和應用程序的變革,以推動生成式 AI 的創新發展。
為了滿足企業需求,亞馬遜云科技的生成式 AI 技術在過去幾年里主要做了以下 5 方面的技術探索:
靈活性:從 AI21 Labs、Anthropic、Stability AI 以及亞馬遜公司構建的基礎模型中選擇,以找到適合企業使用的模型。
安全自定義:僅需數個已標記樣本,就可為企業企業定制基礎模型。所有數據都會加密,不會從亞馬遜云科技虛擬私有云(VPC)泄露企業數據,數據將始終保持私密且機密。
成本效益高的基礎設施:利用由亞馬遜云科技設計的機器學習芯片和 NVIDIA GPU 驅動的基礎設施,可為生成式人工智能帶來最佳性價比。經濟有效地擴展基礎設施,以訓練和運行包含數千億個參數的基礎模型。
輕松上手的基礎模型構建:使用熟悉的控件與亞馬遜云科技能力和服務,如 Amazon SageMaker 和 Amazon S3 的深度和廣度的集成,快速將基礎模型集成并部署到企業在亞馬遜云科技上運行的應用程序和工作負載中。
生成式 AI 技術支持的解決方案:由于內置生成式人工智能,如 Amazon CodeWhisperer(一種人工智能編碼伴侶)等服務可幫助企業提高效率。此外,可使用亞馬遜云科技樣例解決在方案部署中常見的生成式人工智能案例,如調用歸納總結與問答。此類解決方案將亞馬遜云科技人工智能服務與領先的基礎模型相結合。
在企業期待中,亞馬遜云科技在本次發布會中推出了 Amazon Bedrock 和 Amazon Titan 模型,為基礎模型構建和擴展。此外,Bedrock 還提供了一系列的 API,幫助開發者輕松地使用生成式 AI 技術。例如,生成式 AI 對話 API 可以在幾分鐘內創建自然的、可定制的對話體驗,使企業能夠為客戶提供更好的服務和支持。此外,生成式 AI 文本 API 可以根據自然語言生成定制的文本,從而幫助企業更快地生成產品說明、推廣文案等內容。
亞馬遜云科技的生成式 AI 技術提供了強大、靈活和安全的解決方案,旨在幫助企業實現數字化轉型并提高業務效率。通過基礎模型的靈活選擇、安全的自定義功能、成本效益高的基礎設施、易于上手的基礎模型構建和生成式 AI 技術支持的解決方案,企業可以快速構建、部署和定制化生成式 AI 應用程序,從而更好地服務于客戶,并提高自身的競爭力。
左:來自亞馬遜云科技的基礎模型;右:來自 AI21 Labs、Anthropic 和 Stability AI 的基礎模型
三、技術革命:
生成式 AI 也需要生態
生成式 AI 技術的運行、構建和定制基礎模型都需要高性能、低成本且為機器學習專門構建的基礎設施。除了滿足這些業務需求,企業技術的底層需要離不開生態系統的支持。在這個領域,亞馬遜云科技致力于在模型和生態系統兩個方面進行創新。
在本次發布會上,亞馬遜云科技推出了兩款專門針對生成式 AI 優化的計算實例:EC2 Trn1n 實例和 EC2 Inf2 實例。訓練實例 EC2 Trn1 由亞馬遜自研芯片 Trainium 支持,比其他任何 EC2 實例節省高達 50% 的訓練成本。經過優化,它已經可以在與高達 800Gbps 的第二代 EFA(彈性結構適配器)網絡相連的多個服務器上分發訓練任務。但是,更為強悍的 Trn1n 實例可提供 1600 Gbps 的網絡帶寬,專為大型網絡密集型模型設計,性能比 Trn1 高出 20%。企業在超大規模集群中部署 Trn1 實例時,可擴展到在同一可用區中的 3 萬個 Trainium 芯片,相當于超過 6 exaflops 的計算能力。Helixon、Money Forward 和亞馬遜云科技的搜索團隊使用 Trn1 實例后,將訓練大規模深度學習模型的時間從幾個月縮短到了幾天。因此,亞馬遜云科技發布的性能全面提升的全新網絡優化型 Trn1n 實例將會給我們帶來更多驚喜。
2018 年,亞馬遜云科技發布了首款推理專用芯片 Inferentia,使用 Inferentia 運行數萬億次推理,節省了數億美元的成本。這次推理實例 Inf2 是基于其自研芯片 Inferentia2 的,針對運行數千億個參數模型的大規模生成式 AI 應用程序進行了優化,吞吐量提高了 4 倍。
除了以上所述的芯片和工具,亞馬遜云科技還推出了一系列面向生成式 AI 的解決方案和服務,包括:
SageMaker GAN 調優:這是一種基于 SageMaker 平臺的生成式對抗網絡(GAN)調優工具,可幫助企業降低訓練成本、加速訓練速度、提高模型效果。
SageMaker Autopilot:這是一種全自動機器學習(AutoML)工具,可根據數據集自動選擇最佳算法、調優超參數,并生成最佳模型。
SageMaker Studio:這是一種云端集成開發環境(IDE),可幫助企業快速構建、訓練和部署機器學習模型。
Amazon Elastic Inference:這是一種低延遲、低成本的推理加速器,可提供可擴展的推理性能,幫助企業降低推理成本。
Amazon S3:這是一種面向生成式 AI 數據存儲的云端存儲服務,可提供高可靠性、高可擴展性的數據存儲和訪問服務。
總之,隨著生成式 AI 技術的快速發展,亞馬遜云科技在基礎設施、芯片、工具和服務等方面不斷創新,為企業提供更加完整和全面的技術支持,助力企業實現數字化轉型,提高效率和競爭力。
圖:CodeWhisperer 三大能力
CodeWhisperer是一款可以通過使用引擎蓋下的FM根據開發人員的自然語言評論和IDE中的先前代碼實時生成代碼建議的AI編碼伴侶,可以顯著提高開發人員的效率。該工具目前提供十余種開發語言,如Python、Java、JavaScript、TypeScript、C#、Go、Kotlin、Rust、PHP和SQL等,并且可以通過在VS Code、IntelliJ IDEA、Amazon Cloud9等集成開發環境中的Amazon Toolkit插件進行訪問。此外,CodeWhisperer利用亞馬遜云科技在安全方面的積累來掃描各種安全問題,能夠自動掃描代碼中的安全漏洞并幫助用戶修復,從而增強代碼的安全性。
對于云計算的發展來說,構建像CodeWhisperer這樣的強大應用程序對開發人員來說是變革性的,同時利用正確的基礎模型進行構建相關工具是非常必要的。生成式AI的發展需要在基礎設施、一站式應用開發工具等層面“全面開花”,亞馬遜云科技已經為行業做出了一個很好的表率。對于云廠商來說,打造生態協同效應,切實幫助企業實現降本增效,才能夠走得更遠。而形成“大小生態”的良好閉環是打造生態協同的必由之路,亞馬遜云科技似乎就是在探索這樣的一條路。人工智能作為云計算的一部分,人工智能產品構建自己的“AI小生態”,通過“小生態”的構建去推動“云平臺大生態”的發展,云廠商再利用“大生態”的勢能反哺“AI小生態”,轉而促進單一AI能力的發展。
從目前亞馬遜云科技搭建的“AI小生態”來看,這些生成式AI能力和工具為企業解決問題提供了切實可行的技術解決方案,不再是那些冰冷的性能提升數字,而是卓越性價比。亞馬遜云科技之所以能夠實現這些突破,源于將每一個客戶的難題都視為一個新的探索方向,將“探索精神”和“創新精神”貫徹始終,輸出接地氣的技術能力和解決方案。不積跬步無以至千里,亞馬遜云科技憑借其多年來積累的企業服務經驗,深刻理解企業需求,并在實際業務中持續獲取洞察,這必定能幫助亞馬遜云科技在市場競爭中脫穎而出。