VISI.NEWS | SHANGHAI, TIONGKOK – Pada hari kedua HUAWEI CONNECT 2025, Zhang Ping’an, Direktur Eksekutif Huawei dan CEO Huawei Cloud, menyampaikan pidato utama berjudul “All Intelligence: Empowering AI Pioneers for Industries”. Dalam pidatonya, ia membagikan inovasi dan praktik Huawei Cloud dalam layanan komputasi AI, model dasar, AI yang tertanam (embodied AI), agen AI, dan banyak lagi.
Inovasi Berkelanjutan dalam Layanan Komputasi AI: Membuka Potensi Komputasi yang Kuat di Era Cerdas
Tahun ini, Huawei Cloud mengumumkan Layanan Komputasi AI yang didorong oleh CloudMatrix384. Spesifikasi supernode Huawei CloudMatrix akan ditingkatkan dari 384 kartu menjadi 8.192 kartu. Supernode ini dapat mendukung klaster hiperskala yang berjalan pada 500.000 hingga 1 juta kartu, sehingga menyediakan komputasi AI yang kuat, sumber daya tak ternilai di era cerdas. Huawei Cloud juga mengumumkan inovasi penyimpanan memori dengan Elastic Memory Service (EMS), yang mencapai terobosan industri pertama dengan memperluas video RAM dengan memori. Hal ini secara drastis mengurangi latensi percakapan multi-putaran pada model dasar, secara signifikan meningkatkan pengalaman pengguna.
Huawei Cloud telah membangun pusat data AI berpendingin cair sepenuhnya di Guizhou, Mongolia Dalam, dan Anhui, Tiongkok. Pusat data AI ini mendukung dissipasi panas hingga 80 kW per rak, mengurangi efektivitas penggunaan daya (PUE) menjadi 1,1, dan menawarkan O&M yang didukung oleh AI. Ini berarti perusahaan tidak perlu membangun ulang pusat data tradisional atau membangun yang baru. Sebaliknya, mereka hanya membutuhkan sepasang serat optik untuk menghubungkan ke pusat data dan mengakses komputasi AI yang efisien, serta layanan cloud AI khusus full-stack, di Huawei Cloud.
Zhang Ping’an menekankan bahwa Layanan AI Token Huawei Cloud mengabstraksi kompleksitas teknis yang mendasarinya dan langsung memberikan hasil komputasi AI kepada pengguna. Ini memungkinkan pengguna untuk memanfaatkan daya komputasi inferensi dengan cara yang paling efisien. Supernode CloudMatrix384 mewujudkan pemrograman penuh dari sumber daya komputasi, memori, dan penyimpanan, memisahkan tugas komputasi, tugas penyimpanan, dan sistem ahli AI, serta mengubah tugas serial menjadi tugas paralel terdistribusi, yang secara signifikan meningkatkan kinerja inferensi sistem. Dalam skenario yang melibatkan tugas inferensi dengan persyaratan latensi yang berbeda, seperti inferensi online, nearline, dan offline, CloudMatrix384 memberikan kinerja inferensi rata-rata per kartu yang 3 hingga 4 kali lipat lebih cepat dibandingkan dengan H20.
Pada konferensi ini, Zhang Ping’an mengumumkan peluncuran resmi Layanan AI Token yang didorong oleh CloudMatrix384. Layanan ini memberikan kinerja, layanan, dan kualitas superior kepada pelanggan.
Menghadapi Tantangan Secara Langsung: Membantu Perusahaan Membangun Model Mereka Sendiri
Huawei Cloud telah mematangkan Pangu Models dengan menyelami skenario industri spesifik dan telah bekerja sama dengan pelanggannya untuk mengatasi tantangan paling mendesak di sektor-sektor ini, membayangkan kemungkinan-kemungkinan baru dalam industri-industri tersebut. Huawei menggunakan openPangu untuk memberikan praktik terbaik dalam pelatihan dan inferensi AI, memudahkan pengembang untuk menggunakan daya komputasi AI dengan lebih efisien. Zhang Ping’an mencatat bahwa, pada saat yang sama, Huawei sedang mengembangkan Pangu Model versi tertutup. Huawei akan terus meningkatkan investasi dalam Pangu Models dan mempercepat transformasi cerdas di seluruh industri.
Pangu Models telah diterapkan dalam lebih dari 500 skenario di lebih dari 30 industri, seperti keuangan, manufaktur, kesehatan, pertambangan batu bara, baja, kereta api, mobil otonom, dan meteorologi.
Melampaui Terminal: Memungkinkan Evolusi Kecerdasan Tak Terbatas di Cloud
Tahun ini, Huawei Cloud meluncurkan CloudRobo Embodied AI Platform, yang menyebarkan algoritma kompleks dan logika cerdas di cloud untuk mewujudkan robot yang lebih ringan. Dengan memanfaatkan kekuatan komputasi besar dan model AI canggih di cloud, platform ini membuat eksekusi robot lebih cerdas. Kecerdasan cloud mengatasi keterbatasan yang selama ini menghalangi robot, membuatnya lebih aplikatif dalam berbagai skenario.
Untuk membangun saluran komunikasi yang bersatu, terbuka, dan aman antara robot dan cloud, Huawei Cloud telah meluncurkan Robot to Cloud (R2C) Protocol. Zhang Ping’an mengumumkan bahwa 20 mitra pertama dari Protokol R2C telah resmi bergabung.
Kunpeng Cloud Services: Memberdayakan Inovasi Industri dengan Sinergi Perangkat Lunak-Hardware dan Ekosistem Terbuka
Salah satu strategi utama Huawei Cloud adalah mengembangkan layanan cloud ARM berbasis Kunpeng yang menawarkan kinerja, keamanan, dan keandalan. Dalam setahun terakhir, jumlah inti komputasi Kunpeng di Huawei Cloud telah meningkat dari 9 juta menjadi 15 juta, sebuah kenaikan sebesar 67%.
GaussDB: Membangun Fondasi Data yang Efisien dan Andal Berdasarkan Supernode dan Pooling Penuh
Berdasarkan supernode komputasi serbaguna, database GaussDB milik Huawei Cloud mewujudkan pooling bertingkat dari sumber daya komputasi, memori, dan penyimpanan, dan memungkinkan multi-baca dan multi-tulis pada setiap node secara bersamaan, mematahkan batasan arsitektur tradisional di mana hanya node utama yang mendukung pembacaan/penulisan data. Klaster GaussDB yang diterapkan berdasarkan supernode komputasi dapat memproses 5,4 juta transaksi per menit, mencatatkan peningkatan kinerja sebesar 2,9 kali lipat dibandingkan dengan klaster non-supernode.
@uli












