大型機沒有滅亡,反而正成為AI、混合云的寵兒
作者:趙滿滿
編輯:小宏
編審:楊小天
頭圖來源:中培偉業
本文是《中智觀察》“企業數字服務供需市場”行業洞察之人工智能篇。二三十年前,專家就預言了大型機的死亡。然而,誕生70多年的古老的大型機不但沒有消亡,而且又開始抬頭了,在混合云、AI、量子計算等新興領域大展拳腳。基于關鍵業務和AI應用,IBM的大型機能夠咸魚翻身,再造輝煌嗎?
——海比研究院
2022年5月23日
在20世紀50年代初,大型機開始進入市場,“藍色巨人”IBM 和七個“小矮人”——Burroughs、Unisys、NCR、Control Data、Honeywell、GE和RCA用大型機創造了計算時代,并在最大的組織和企業中爭奪關鍵應用、復雜建模以及大規模事務和工作負載。
在過去的70多年中,計算能力、存儲和網絡在每一波顛覆性技術浪潮中,出現了多次各種集中化和去中心化浪潮。
在這每一波體系架構浪潮中,專家、分析師和行業觀察人士都預言了大型機因為昂貴、復雜、封閉等而“死亡”。
然而,70多年過去了,古老的大型機又開始抬頭了。
對于許多CIO來說,混合云都是“and”戰略,而不是“or”戰略。對于許多企業來說,在與亞馬遜云科技、微軟Azure、阿里云、騰訊云、華為云等公有云合作的同時,出于成本和安全原因,將其密集型工作負載保留在大型機上。
另一方面,大型機已經為AI應用做好了準備。2022年4月,IBM最新的大型機IBM z16及其集成的片上Telum AI加速器已準備好大規模分析實時事務,非常適合大型機關鍵型任務工作負載,如醫療保健和金融交易等,并開始受到用戶的青睞。
IBM CEO Arvind Krishna表示,全球市場正處于達到關鍵AI臨界點的風口浪尖,該臨界點將釋放重大的生產力提升。那么AI會成為大型機的新領地嗎?IBM能借助大型機在AI、混合云,甚至是量子計算等方面,再造輝煌嗎?
圖片來源:IBM
1991年3月,當時的風險投資家、InfoWorld的主編Stewart Alsop首次預測,最后一臺大型機將于1996年3月15日拔掉電源。
在此后的30年中,沒有人懷疑,大型機將走向滅亡的預言。但是,大型機消亡了嗎?
大型機在70年后仍然保持強勁威力。
在2020年第四季度大型機使用情況通報中,IBM分享了有關大型機采用情況的統計數據。
其中,財富100強中的67位,前50大銀行中的45家,前10大保險公司中的8家,前10大電信公司中的8家,前10大零售商中的7家,前5大航空公司中的4家等,都在使用大型機。
在過去十年,IBM大型機的使用數量增長了350%。
市場研究機構Forrester在2019年對IBM大型機專業人員的調查結果顯示,近90%的企業計算專業人士認為其技能組合的就業市場需求正在增長,75%的人認為市場對大型機技能的需求很高。
在2020年德勤的調查中證實,大型機的使用量繼續增長,74%的受訪者認為,大型機作為其組織的戰略平臺具有長期可行性。91%的受訪者認為,在未來12個月內,擴展其大型機業務是一項中等或關鍵的優先事項。72% 的企業計劃在未來三年內升級其大型機。
大型機Mainframe更多地被形容成一整套操作、應用和系統的集合,目前廣義上已經把之前更加細分的大型機、小型機、其他一些Unix系統等,基本都歸類為大型機了。
其核心是采用專心的CPU,如IBM Power/HP RISC等,而不是現在工業標準的x86 CPU;采用的操作系統為專用Unix系統,當然現在則采用了Liunx系統;采用專用的中間件和應用系統等。金融系統一直是應用大型機數量最大最集中的領域。
IBM CEO Arvind Krishna
第三,AI已經成為IBM和大型機發展的重要應用領域。
IBM CEO Arvind Krishna在2022年的Think大會表示: “在數字化轉型浪潮的引領下,技術成為競爭優勢之源。我們的客戶和合作伙伴相信IBM能夠持續創新,提供混合云、人工智能和咨詢相關解決方案,為其業務保駕護航。”
IBM發布了2022年全球人工智能采用指數。報告顯示,目前,35%的公司正在其業務中使用人工智能,比2021年高出4個百分點。此外,30%的受訪者表示,組織的員工已經通過新的人工智能和自動化軟件和工具節省了時間。
Krishna說:“人工智能迅速發展的原因是,我們每天產生的數據為2.5萬億字節。任何數量的人類都不可能處理它。舊的分析和數據庫技術是不夠的。人工智能是唯一能夠利用和收集這些數據以獲得洞察力的工具。”
因此,IBM在AI發展上,也把大型機納入了發展規劃,為此專門推出專用的推理芯片和大型機。
擁有Telum芯,實現欺詐檢測等AI推理工作負載。
2021年,藍色巨人IBM推出了Telum,首款具有AI推理加速功能的芯片,使其能夠在交易發生時執行欺詐檢測等任務。
IBM介紹說,該芯片包含8個處理器內核,具有深度超標量無序指令流水線,以超過5GHz的時鐘頻率運行,針對異構企業級工作負載的需求進行了優化。
同時,完全重新設計的緩存和芯片互連基礎設施為每個內核提供32MB的緩存,并且可以擴展到32個Telum芯片。雙芯片模塊設計包含220億個晶體管和17層金屬層上的19英里導線。
IBM Z硬件開發高級技術人員Anthony Saporito表示,L2緩存可以組合并形成虛擬的256MB L3緩存,最多8個Telum芯片可以組合成虛擬的2GB L4緩存。
Telum設計的關鍵創新之一是,在芯片上構建了一個AI加速器,直接連接了所有內核,并通過硬件設計、固件、操作系統以及能夠將深度學習帶入交易的軟件,在堆棧上構建了一個生態系統。
借助這項技術,不僅可以達到每秒成千上萬的交易,具有高可靠性和零停機時間特性,而且能夠進行實時深度學習推理、欺詐檢測和分析。
另一大創新是IBM Research創建了一款采用2nm制造的測試半導體技術,與基于7nm的芯片相比,使用相同的功率,性能將提高45%,或者只使用75%的能源。
2nm技術將于2024年底投入生產。大規模使用可能會在2025年左右出現。
而目前最先進的半導體制造工藝是5mn,IBM展示給大家的是一個可以組裝的2nm晶體管。意味著這個行業將在未來十年內持續改善半導體制造工藝。
該芯片基于三星創建的7nm極紫外技術構建。在開發三年后,第一個使用該芯片的大型機Z16已經于2022年4月推出。
第一臺面向AI的IBM大型機已經問世。
2022年4月,IBM推出了最新一代的大型機IBM z16,配備IBM Telum 處理器,可提供實時 AI洞察。
IBM用自己的實力想行業證明,大型機在2022年與1960年代一樣重要。
海比研究院通過觀察發現,定位于AI應用的IBM z16有其不可忽視的優質特性:
第一,用于推理的Telum AI加速器是行業首創。IBM z16及其集成的片上Telum AI加速器已準備好大規模分析實時事務,適合大型機任務關鍵型工作負載,如醫療保健和金融交易等。
這款21世紀的Big Iron AI加速器內置于其核心Telum處理器上。借助這款新的雙處理器 5.2 GHz 芯片及其16內核,每天可以執行3000 億次深度學習推理,延遲為1毫秒。
分析師認為,人工智能加速器是一個游戲規則改變者。與平均網絡延遲為60毫秒的同類 x86云服務器相比,采用z/OS的z16在推理時具有20倍的響應時間,吞吐量提高了19倍。
Tellum處理器上的AI加速器,利用AI推理模型分析大型機內進行的大量事務處理的細節,以發現趨勢并做出智能預測。
第二,首配量子安全系統。z16還包括一個所謂的量子安全系統(Quantum-safe),以保護組織免受可能破解當今加密文件的未來威脅。這是在z16對Crypto Express8S適配器的支持下完成的。
它圍繞CCA加密協處理器和PKCS #11加密協處理器構建,使用戶能夠開發量子安全加密。它也適用于經典密碼學。
借助 IBM z16 的創新,客戶可以在關鍵型數據所在的位置通過推理來提高決策速度。
第三,更多應用場景。隨著諸如即時支付、反洗錢 (AML) 等越來越嚴格的法規以及在線交易的急劇增加,欺詐的數量在逐年上升。IBM z16通過嵌入式 AI ,能夠實時、大規模地處理大量關鍵事務和工作負載,幫助企業降低風險。
Telum處理器的應用場景還包括貸款審核、加密貨幣的清算、結算、逃稅及零售業聯邦學習(Federated learning)防范欺詐及盜竊等在內的各類業務。比如,它可以加快金融機構對企業或消費貸款的審批,也可以幫助確定結算前哪些貿易和/或交易可能存在高風險。
5年前,日立公司決定停止開發自有大型機產品。今年2月,富士通又宣布將在2030年放棄大型機業務。
近些年來,大型機市場的“玩家”正在以肉眼可見的速度在減少。
但是大型機留下的市場空間卻沒有人會忽視。AWS推出一系列服務,將大型機工業級工作負載遷移到云中。AWS 首席執行官 Adam Selipsky說,大型機既昂貴又復雜,并且具有傳統的編程方式。通過將大型機工作負載遷移到云端,客戶能夠將成本降低多達70%。
但是,無論采取哪種方式,從大型機的遷移都可能需要數月到數年才能完成。大型機被替代的進程并不順利。
行業專家認為,IBM 2019年發布的IBM z15,被稱為“為云而生”的主機,其一大亮點是幫助企業實現跨混合云環境管理客戶數據隱私,支持企業的云遷移和混合云環境下的業務創新。
而今年IBM推出了大型機——IBM z16,將是為AI而生的。
日趨成熟的AI技術成為企業加速技能升級的“精良裝備”,但與此同時,計算壓力也如“排山倒海”般涌向后端。
以金融欺詐場景為例,根據IBM和Morning Consult推出的《2022年IBM全球金融欺詐影響報告》,由于計算延遲問題,大規模實時運行深度學習模型難以實現,金融應用中的欺詐檢測模型只在不到10%的大批量交易中運行,還有大量的欺詐無法被檢測到。
這些應用場景都為z16提供了用武之地。根據 IBM的內部基準測試,借助Telum處理器,IBM z16每天可以處理 3000億個推理請求,延遲時間僅為1毫秒。
美國某銀行已經基于IBM zSystem,將AI的欺詐檢測引入其信用卡授權流程中。他們曾經試圖在平臺外執行類似的操作,但基本最快的響應速度也需要超過80毫秒。而引入AI加速器之后,不僅響應時間縮短到單毫秒延遲,并且交易處理量還從每秒1200筆,擴展到了每秒15000 -20000筆,這意味著他們可以分析每一筆交易。
作為關鍵任務設施,大型機中承載著海量數據,某些信息甚至可以追溯到幾十年之前。其中最大的挑戰在于AI這一新興技術缺乏向前兼容的能力。
大型機的功能同樣在快速發展。例如,IBM公司就一直在努力針對AI應用調整其Z系統,包括將其與各類常見開源平臺如Spark、PyTorch、Keras以及TensorFlow等相集成。
IBM正努力幫助客戶以最少的應用改動將AI嵌入到企業關鍵任務工作負載與核心業務流程中,并在滿足最嚴苛服務水平協議(SLA)的同時對每項事務做出評分。
通過在Z系統上生成AI洞見,客戶可以利用大型機上的過往數據,可在交互點上實現實時響應,進而建立起欺詐檢測到重要用例。同時由于無需移動任何敏感數據,因而還有著明顯的安全優勢。
海比研究院認為,大型機并沒有固步自封,x86也不是事事如意。因此,當AI大型機推出,并得到頂級組織青睞時,一點都不用驚奇,畢竟用戶最看重的是自己業務的發展。
本文作者系趙滿滿
本文來自微信公眾號 “中智觀察”(ID:Hapiweb-soft6),36氪經授權發布。
