新闻资讯

DeepSeek

日期：2025-01-26 08:37 浏览：

起源：IT之家 “奥秘西方力气”DeepSeek 给硅谷带来的影响，还在一直出现荡漾 —— 刚，DeepSeek-R1 跻身年夜模子竞技榜前三。以开源、廉价 20 倍的“身价”与 ChatGPT-4o（2024.11.20）并列。在庞杂提醒词 / 作风把持榜单上，R1 位列第一。现在成果来看，它在各个维度上都坚持当先。在权衡模子编程开辟才能的 WebDev 分榜上，R1 位列第二，与闭源的 Claude 3.5 Sonnet 相差不到 40 分。网友实测休会表现，确切如斯，R1 在 30 场 battle 中只输了 4、5 次。另一边，硅谷对 DeepSeek 的猎奇不减。究竟，它但是一个“副业”。开创人梁文锋的中文采访更是被翻译成英文，“拿着缩小镜”逐字当真浏览。他提出的观念也被总结成规语，在互联网下流传。真正的差距不是 1 年或 2 年，而在于是原创仍是模拟。图灵奖得主 LeCun 也为 DeepSeek 做出中肯评估：它代表了开源的力气。这象征着，开源模子正在超出专有模子。值得一提的是，同为开源范畴代表的 Meta 刚颁布了 2025 年在 AI 范畴的规划打算：650 亿美元，投算力、投人才。有爆料称，Meta 外部曾经由于 DeepSeek 觉得惊恐。 “他们让 OpenAI 一次又一次看清本人” 以是，在硅谷视角里，他们更关怀 DeepSeek 的哪些信息？最重要的莫过于，DeepSeek 怎样赢利。挖到的信息有点出其不意，或者 DeepSeek 还没想赢利的事。控股 DeepSeek 的是幻方量化，他们有一批顶级迷信家，有富余的算力资本，DeepSeek 实在是一个“副产品”。在 2023 岁终我就据说他们在做 DeepSeek。即便在事先的中国，还不人把他们当回事。其次，为何 DeepSeek 能胜利。梁文锋在 2023 年 5 月 2024 年 7 月接收暗涌的两次采访，也被老外扒出来了。他们最关怀的五个方面分辨是： 1、翻新第一性准则：与其余努力于疾速贸易化的中国 AI 公司差别，DeepSeek 专一于基本的 AGI 研讨跟翻新。他们以为，中国必需从寰球人工智能开展的“搭便车者”改变为“奉献者”。梁文锋说，翻新不完整是贸易驱动的，还须要猎奇心跟发明欲。 2、反动性架构：DeepSeek V2 中采取的新型 MLA（多头潜伏留神力机制）架构，把显存占用降到了从前最常用的 MHA 架构的 5%-13%，实现了本钱年夜幅下降。它的推理本钱仅为 Llama 370B 的 1/7、GPT-4 Turbo 的 1/70。这并不是为了挑起一场价钱战 —— 他们只是在“本钱上略微有点利润”来订价。这种翻新架构持续利用于 V3 跟 R1 模子中。 3、奇特的公司文明跟人才策略：DeepSeek 坚持着一个完整自下而上的构造构造，为研讨职员供给无穷的盘算资本，优先看发明热忱而不是证书。他们的冲破性翻新来自年青的外乡人才 —— 中国外乡的应届结业生跟年青技巧人才，而非海内应聘。 4、努力于开源：只管行业开端趋势于闭源模子（OpenAI 跟 Mistral），DeepSeek 仍努力于开源，并以为开源对树立一个强盛的技巧生态体系至关主要。梁文锋以为，在推翻性技巧眼前，闭源构成的护城河是长久的。他们的真正代价在于树立一个具有翻新才能的构造。 5、底层盘算挑衅：只管领有充足的资金跟技巧，DeepSeek 也面对来自底层盘算的挑衅跟压力。现在公司还不新的融资打算。梁文锋以为，面对的重要制约要素不是资金，而是高端算力的应用权，这些芯片对练习进步 AI 模子至关主要。除此之外，采访中的诸多细节也被网友当真咀嚼。原文中，梁文锋被问道：怎样对待做量化同时做大批基本研发，不烧钱吗？他答复：一件冲动民气的事，或者不克不及纯真用钱权衡。就像家里买钢琴，一来买得起，二来是由于有一群急于在下面弹吹打曲的人。海内网友感叹：这帮人是一群有点幻想化的“技巧狂”，他们深信本人能搞出通用人工智能（AGI），并且他们确切有这个资本跟禀赋。我真是太爱好他们了！别的也防止不了一些对照：梁文锋展示出一种完整差别的心态，他们的胜利当之无愧，我也很等待看到他们一次又一次让“OpenAI”认清本人。固然放眼 AI 范畴的团体开展，可能看到 DeepSeek，对全部人而言或者都是高兴的。只管我不由得感到他们有点无邪，究竟在贸易化上他们有点“自断后路”。但看到一个团队保持幻想并获得胜利，确切让人感到很快慰。跟着 R1 的冷艳表态，DeepSeek 正在兑现本人所说的所有。拓宽技巧界限、保持开源、专一于技巧开辟…… 那么，DeepSeek 是怎样走到当初的呢？用 AI 做量化，再回到 AI 梁文锋本硕均就读于浙江年夜学信息与电子工程学专业。 2008 年，梁文锋结业，开端率领团队应用呆板进修等技巧摸索全主动量化买卖。事先量化在海内仍是个新颖观点，是否赢利是个未知数。2010 年沪深 300 股指期货推出，量化投资迎来春天。据公然信息表现，梁文锋团队恰是乘上这股春风，很快自营资金超越 5 亿元。与此同时，深度进修海潮的齿轮开端滚动，人工智能率先在硅谷暴发。 2015 年，梁文锋与校友独特创建幻方量化。仅仅 1 年后，他们就推出了旗下第一个 AI 模子，第一份由深度进修天生的买卖仓位上线履行，应用 GPU 停止盘算。 2017 年，幻方量化声称实现投资战略片面 AI 化。 2018 年，幻方量化建立 AI 为公司的重要开展偏向。 AI 加持下，幻方量化旗下基金报答率远超同期沪深 300 指数。2019 年，资金治理范围冲破百亿元。 2019 年，梁文锋在昔时的金牛奖颁奖典礼上，宣布主题报告《一名顺序员眼里中国量化投资的将来》，这是他少见的公然报告。报告全文确实充斥“顺序员视角”：量化公司是不基金司理的，基金司理就是一堆效劳器。人来做投资决议的时间，它是一种艺术，要凭感到。顺序来决议的时间，它是一种迷信，它有最优解。也是这一年，幻方量化开端年夜范围规划 AI 算力，搭建起“萤火一号”集群。2021 年，“萤火二号”完工。如许的算力基建，成为现在 DeepSeek 疾速奔驰的底层支持。 2021 年，幻方量化成为海内首家冲破千亿范围的的量化私募年夜厂，被称为海内量化私募“四年夜天王”之一。值得一提的是，在幻方量化的官网上，AI 基本迷信研讨一直盘踞主要地位，包含在年夜模子海潮前。幻方量化曾表现，多年以来，该公司保持把营收的年夜局部投入人工智能范畴，建立当先的 AI 硬件基本设备，停止年夜范围的研讨，摸索人类未知的神秘。咱们信任多少乎全部的翻新都是从勇敢实验跟点滴积聚中孕育而来。 2023 年，幻方量化将了局做年夜模子的自力新构造定名为深度求索，并夸大将专一于做真君子类级其余人工智能。目的不是复刻 ChatGPT，而是研讨跟揭秘 AGI 的更多未知信息。 DeepSeek 的故事也就开端于这一刻。一个 80 后顺序员在搅动中国量化市场后，实现资金积聚，组建起年青发达的团队，仿佛又回到了他底本的出发点、回到 AI，但发生的能量正在寰球掀起骇浪。 One More Thing 值得一提的是，幻方量化还临时向慈悲机构捐献，官网表露公司员工“一只平常的小猪”团体捐助 1.38 亿元，支撑 15 家慈悲机构的 23 个公益名目，在天下范畴内辅助弱势群体，增进社会的公正跟开展。爆料新闻称，这个员工就是梁文锋自己。参考链接： [1]https：//www.reddit.com/r/LocalLLaMA/comments/1i6dlvj/inside_deepseeks_bold_mission_ceo_liang_wenfeng/ [2]https：//www.threads.net/@yannlecun/post/DFNvN3euNEV？xmt=AQGzPcW8Rr7oXT6-rHIoKzBNL5x2PNnaprvJBL6uIhgoQA

新闻资讯

DeepSeek

恒峰娱乐

新闻资讯

成功案例

联系我们