Aplikasi.ac.id –
DeepSeek memperkenalkan model AI canggih bernama R1, yang dinilai powerful mengalahkan beberapa model AI lain, meski perusahaan mengklaim pelatihannya hanya menghabiskan biaya sekitar USD 6 juta dengan 2.048 GPU. Namun, menurut laporan dari SemiAnalysis, ada kemungkinan kalau perusahaan ini sebenarnya tidak mengumumkan angka investasi yang sesungguhnya.
Disebut-sebut kalau DeepSeek menginvestasikan sekitar USD 1,6 miliar untuk hardware, dengan total infrastruktur mencapai 50.000 GPU Nvidia Hopper. Angka ini tentu membuat klaim “hemat biaya” yang semula dicanangkan semakin dipertanyakan.

Seberapa Besar Infrastruktur DeepSeek?
DeepSeek sendiri merupakan spin-off dari High-Flyer, sebuah hedge fund China yang telah lama mengandalkan teknologi AI dan berinvestasi besar pada GPU. Pada 2023, High-Flyer meluncurkan DeepSeek sebagai entitas terpisah yang fokus penuh pada pengembangan AI.
Berbeda dengan banyak startup AI lain yang mengandalkan layanan cloud dari pihak ketiga, DeepSeek sudah punya data center miliknya sendiri. Jadi mereka bisa mengontrol penuh eksperimen dan optimasi model, sehingga memungkinkan iterasi dan inovasi dilakukan dengan cepat.
Baca Juga: India Mau Bikin Model AI Lokal, Siap Saingi DeepSeek dan ChatGPT • Exelbiz
Infrastruktur DeepSeek sendiri kemungkinan sangat luas. Selain 50.000 GPU Nvidia Hopper, juga disebut-sebut menggunakan 10.000 unit H800, 10.000 unit H100, dan beberapa unit H20 yang tersebar di berbagai lokasi.
GPU ini tidak hanya dipakai untuk pelatihan model AI, tetapi juga untuk riset dan pemodelan keuangan. Investasi besar pada server dan operasional membuat biaya total mencapai hampir USD 1,6 miliar untuk server dan sekitar USD 944 juta untuk biaya operasional.
Jadi, walaupun ada klaim biaya pelatihan yang sangat rendah, angka USD 6 juta tersebut sebenarnya hanya mencakup sebagian kecil dari biaya—yaitu penggunaan GPU untuk pre-training-nya saja. Biaya untuk riset, penyempurnaan model, serta pengeluaran untuk infrastruktur lainnya belum dihitung, sehingga total investasi untuk pengembangan AI di DeepSeek mencapai lebih dari USD 500 juta.
Rekrut Talenta Terbaik, Bergaji Tinggi
Salah satu keunggulan DeepSeek adalah strategi rekrutmen talenta. Perusahaan ini memilih untuk merekrut tenaga ahli dari dalam negeri, terutama lulusan dari universitas terkemuka seperti Peking University dan Zhejiang University.
Pendekatan ini tidak hanya menekankan kemampuan teknis dan pemecahan masalah, tetapi juga memberikan kompensasi tinggi kepada peneliti. Ada beberapa peneliti yang dikabarkan mendapatkan gaji lebih dari USD 1,3 juta, menjadikan DeepSeek sebagai salah satu tempat kerja dengan imbalan terbaik di industri AI China.
Inovasi juga menjadi fokus utama DeepSeek. Perusahaan ini telah melahirkan teknologi baru seperti Multi-Head Latent Attention (MLA) yang membutuhkan pengembangan intensif dan penggunaan GPU dalam waktu berbulan-bulan.
Pendekatan yang diambil adalah meningkatkan efisiensi dan algoritma, bukan hanya mengandalkan peningkatan jumlah GPU secara besar-besaran. Strategi ini diyakini dapat mengubah ekspektasi pengembangan model AI di masa depan.
Namun, seperti yang diungkapkan oleh Elon Musk beberapa waktu lalu, untuk benar-benar kompetitif di dunia AI, investasi yang besar dan “berkelanjutan” sangatlah penting. Jadi, apakah investasi yang dilakukan oleh DeepSeek ini akan berbuah hasil? Kita lihat saja nanti.
Artikel ini Rangkuman Dari Berita : https://www.jagatreview.com/2025/02/deepseek-pakai-50-ribu-gpu-nvidia/