成立於2021年的GMI Cloud,初期以提供比特幣運算節點服務為主,但2023年葉威廷發現客戶、投資人對GPU算力需求高速成長,同年夏天就由加密貨幣轉型為AI算力提供,並成為台灣第一家獲得輝達NCP認證的AI雲端業者,2024第一季便成為輝達NCP認證,今年上半年更成為全球唯六的輝達Reference Platform合作夥伴。
GMI Cloud表示,斥資5億美元打造的台灣AI工廠,全數採用輝達GB300水冷機櫃,GPU數量高達7000顆,並配備輝達Infiniband交換器與乙太網路交換器,一共需要16兆瓦的電力運作,是專為大規模推論、模型微調、多模態工作負載而設計,是第一個在亞洲真正落地、可量產的AI工廠。
為了因應GB300伺服器水冷機櫃對於樓地板承重要求比一般氣冷機櫃高,葉威延表示,GMI Cloud在台灣新設的AI資料中心選擇在桃園龍潭的A-Top園區中承租ㄨ吳一整棟大樓,加以改造使用。
葉威廷宣布,台灣AI工廠第一期3500顆GPU預計在明年第一季提供服務,第一期的算力已經全部被租完,客戶包括緯創為台灣新創捐贈的100萬小時GPU算力、緯創旗下緯謙、趨勢科技等,第二期的3500顆GPU也規劃在明年底前上線。
葉威廷表示,至明年底為止,GMI Cloud全球部署超過1萬顆的GPU,從輝達的H100、H200到輝達的GB300都有,GMI Cloud目前在台灣、泰國、美國都有AI資料中心,國際性客戶中包括美國開源AI模型業者Reflection,「Reflection是美國主權AI,有點像美國版的DeepSeek」,他計劃將Reflection的模型與技術,透過GMI Cloud的AI工廠在台灣落地。
GMI Cloud另外一個知名客戶,是近期獲得好萊塢投資的AI模型業者Utopai,未來要推出的全AI生成的電影「每一幀畫面都是用GMI Cloud在美國的GPU算出來的」,葉威延開心的透露。
但GMI Cloud的AI商業模式不只是單純提供算力,而是讓客戶不用自己上Hugging Face等開源模型網站,花大把時間找可以用的模型與搭配的各種軟體,GMI Cloud都預先幫客戶找好最新可用的開源模型與相關軟體後,客戶一鍵就可以部署完成。
葉威廷表示,商業模式相近的同業,包括雙雙獲得輝達投資、成長飛快的美國業者Together AI與歐洲業者Nebius,「Nebius特別兇、但很棒」,他直言自己壓力很大,但他會繼續推進GMI Cloud成長。
