3月10日,国家超算互联网平台宣布接入阿里巴巴通义千问大模型,提供千问QwQ-32B API服务,用户可免费获得100万tokens。该模型拥有320亿参数,性能与6710亿参数的DeepSeek-R1相当,远超o1-mini及相同尺寸的R1蒸馏模型。
3月10日,阿里云通义灵码在激烈竞标中独家中标建信金融科技有限责任公司的智能编码助手项目。建信金融科技是中国建设银行的子公司,此次选择阿里云标志着其AI代码工具通过了全球领先金融机构的严苛检验。
DeepSeek模型的部署降低了算力门槛,削弱了英伟达等公司的主导地位,硅基流动与华为云的合作则让市场看到了中国芯片的力量。
据清华大学网络空间测绘联合研究中心分析,Ollama的默认配置可能导致未授权访问和模型窃取等安全隐患。
腾讯混元自研的混元TurboS模型具备显著的性能提升,能够实现“秒回”,吐字速度提升一倍,首字时延降低44%。
北京时间每日00:30至08:30为错峰时段,API调用价格大幅下调,DeepSeek-V3降至原价的50%,DeepSeek-R1降至25%。
为了更好地服务用户,经过系列优化,商汤大装置现正式推出企业版,同时完成免费版国产化适配与算力扩容,形成专业强支撑+普惠广覆盖的双擎驱动。
继腾讯元宝从TEG(技术工程事业群)转入CSIG(腾讯云与产业事业群)之后,QQ浏览器、搜狗输入法、ima等更多产品和应用也将汇入CSIG,共同成为腾讯面向大模型时代打出的全新产品组合。
据分析,在64K长文本场景下,NSA实现解码速度提升11.6倍、前向传播9倍加速、反向传播6倍加速。
2月18日,海康威视发布基于观澜大模型技术的文搜NVR和文搜CVR产品。这些产品结合了大参数量、多模态大模型与嵌入式智能硬件,实现秒级图像检索。
截至2025年1月,长三角三省一市在人工智能领域取得显著进展,已有108款大模型完成国家网信办备案,其中2024年最后两个月新增26个。上海已率先实现2025年人工智能产业规模目标,杭州、合肥等城市正全力冲刺。
云南白药集团于2月12日推出国产开源大模型DeepSeek,旨在推动中医药产业数字化升级。该模型自2月9日投入使用,结合企业级数字员工“白小柒”、“重小楼”及协同平台“白药钉”,为企业提供全场景AI深度赋能。
光大证券研报指出,DeepSeek-R1模型凭借强大的推理能力和低成本优势,在智能制造领域迅速获得关注。