內地人工智能公司DeepSeek繼推出開源模型DeepSeek V3之後,再次宣布推出全新推理模型—DeepSeek-R1,引發關注。
公司指,DeepSeek-R1 在後訓練階段大規模使用強化學習技術,在僅有極少標注數據的情況下,極大提升模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩 OpenAI o1 正式版。報道指,DeepSeek-R1同時將應用程序編程接口調用成本,降低90%至95%,使用價格只是 OpenAI o1 的1/30。
輝達高級研究科學家Jim Fan帖文,表示人們正生活在一個特殊的時代:一家非美國公司在真正踐行著 OpenAI 最初的使命——開展真正開放的前沿研究,為所有人賦能。DeepSeek-R1 不僅開源了大量模型,還公開所有訓練細節。
中金公司發表報告指,進入2024年下半年以來,大模型預訓練環節出現進一步放緩跡象,其核心原因是所剩的新的訓練數據或已不足。隨著訓練方法論越來越成熟,算力缺口縮小,人才流動越來越大,龍頭追隨者憑借強大的財力和資源有望縮小和引領者差距,且整體追趕成本相對可控。
報告又指,當下,AI應用方向包括對話機器人,編程助手,辦公效率工具,教育,娛樂,賦能傳統業務等。展望2025年,AI相關公司將重點應用方向聚焦智能體Agent。相比於模型側更偏追趕狀態,對比中美互聯網公司,中國互聯網公司在AI應用方向競爭力較強。