全部标签

DeepSeek

低成本AI革命：DeepSeek的算力优化之道

DeepSeek通过以下创新方法实现低成本AI算力优化，引领行业变革：核心技术突破：混合专家模型架构（MoE）在6710亿参数的DeepSeek-V3中，每次推理仅激活5.5%参数（370亿），通过动态路由技术降低70%显存需求实现与GPT-4o相当性能，训练成本仅557.6万美元（为同类模型的1/10）强化学习驱动训练 DeepSeek-R1采用"冷启动+多轮强化学习&quo…
科技分享
- 45
- 0
demo25年4月12日
DeepSeek如何以算法优化打破GPU算力垄断

根据目前可获取的公开信息，关于DeepSeek如何通过算法优化突破GPU算力垄断的详细技术方案尚未有官方披露。但根据AI行业技术发展规律，此类优化可能涉及以下方向：模型架构创新开发稀疏化神经网络结构，通过动态激活机制减少计算冗余采用混合专家系统（MoE）架构，实现条件化计算路径选择训练策略优化创新分布式训练算法，提升多卡并行效率设计自适应批处理策略，优化显存利用率开发梯度压缩技术，降…
科技分享
- 49
- 0
LC25年4月12日
DeepSeek突破算力封锁引领AI技术新浪潮

DeepSeek作为中国AI领域的创新代表，通过多重技术突破与应用革新，在算力受限的背景下开辟了新路径，引领全球AI技术发展浪潮： 1. 算法革新突破算力瓶颈独创"量子稀疏架构"和强化学习技术，仅用1/10算力实现GPT-4级别性能，训练能耗降低92%。采用GPU底层PTX汇编语言替代CUDA框架，打破英伟达技术垄断，构建自主技术生态。 2. 开源战略重构产业格局全球首个…
科技分享
- 21
- 0
demo25年4月12日
00后用DeepSeek1天卖出3.3亿

在当今数字化时代，人工智能技术正以前所未有的速度渗透到各个商业领域，深刻改变着传统的商业模式和运营方式。其中，DeepSeek大模型的出现，已然成为商业领域一股强大的变革力量，正如近期00后主播借助DeepSeek直播1天卖出3.3亿元这一事件所彰显的那般，其影响力不容小觑。 3月8日，一则震撼业界的消息传来，“交个朋友”抖音直播间在当日实现了单日销售额突破3.3亿元大关的壮举，这一成绩不仅刷新了…
科技分享
- 39
- 0
LC25年3月11日
DeepSeek 吴恩达系 AI 模型日赚 346 万人民币引热议

DeepSeek近期公布的一组AI模型服务盈利测算数据在科技界引发强烈反响。根据2025年2月27日至28日24小时运营数据显示，其V3/R1推理系统在理论上可实现日均收入56.2万美元（约合人民币409万元），扣除8.7万美元（约合人民币63万元）的GPU租赁成本后，理论日利润达47.5万美元（约合人民币346万元），成本利润率高达545%。这一计算基于平均226.75个计算节点（每个节点含8块…
科技分享
- 68
- 0
LC25年3月3日
联想全球首发端侧本地部署 DeepSeek 的 AI PC 新品

联想集团于2025年2月25日正式发布全球首款在端侧本地部署DeepSeek大模型的AI PC产品线，标志着消费级设备在人工智能领域的技术突破进入新阶段。此次推出的YOGA AIPC元启系列包含六款新品，涵盖笔记本与一体机形态，核心创新在于通过蒸馏技术与端侧部署方案，首次在消费级硬件上实现70亿参数大模型的流畅运行。这一技术路径有效解决了传统云端AI处理模式下的隐私泄露风险与网络依赖问题，用户可在…
科技分享
- 71
- 0
LC25年3月3日