欢迎光临恒峰娱乐AG旗舰厅_恒峰娱乐注册登录!
服务热线:400-123-4567

新闻资讯

DeepSeek

日期:2025-01-26 08:37 浏览:
起源:IT之家 “奥秘西方力气”DeepSeek 给硅谷带来的影响,还在一直出现荡漾 —— 刚,DeepSeek-R1 跻身年夜模子竞技榜前三。以开源、廉价 20 倍的“身价”与 ChatGPT-4o(2024.11.20)并列。 在庞杂提醒词 / 作风把持榜单上,R1 位列第一。 现在成果来看,它在各个维度上都坚持当先。 在权衡模子编程开辟才能的 WebDev 分榜上,R1 位列第二,与闭源的 Claude 3.5 Sonnet 相差不到 40 分。 网友实测休会表现,确切如斯,R1 在 30 场 battle 中只输了 4、5 次。 另一边,硅谷对 DeepSeek 的猎奇不减。 究竟,它但是一个“副业”。 开创人梁文锋的中文采访更是被翻译成英文,“拿着缩小镜”逐字当真浏览。 他提出的观念也被总结成规语,在互联网下流传。 真正的差距不是 1 年或 2 年,而在于是原创仍是模拟。 图灵奖得主 LeCun 也为 DeepSeek 做出中肯评估: 它代表了开源的力气。 这象征着,开源模子正在超出专有模子。 值得一提的是,同为开源范畴代表的 Meta 刚颁布了 2025 年在 AI 范畴的规划打算:650 亿美元,投算力、投人才。 有爆料称,Meta 外部曾经由于 DeepSeek 觉得惊恐。 “他们让 OpenAI 一次又一次看清本人” 以是,在硅谷视角里,他们更关怀 DeepSeek 的哪些信息? 最重要的莫过于,DeepSeek 怎样赢利。 挖到的信息有点出其不意,或者 DeepSeek 还没想赢利的事。 控股 DeepSeek 的是幻方量化,他们有一批顶级迷信家,有富余的算力资本,DeepSeek 实在是一个“副产品”。 在 2023 岁终我就据说他们在做 DeepSeek。即便在事先的中国,还不人把他们当回事。 其次,为何 DeepSeek 能胜利。梁文锋在 2023 年 5 月 2024 年 7 月接收暗涌的两次采访,也被老外扒出来了。 他们最关怀的五个方面分辨是: 1、翻新第一性准则:与其余努力于疾速贸易化的中国 AI 公司差别,DeepSeek 专一于基本的 AGI 研讨跟翻新。他们以为,中国必需从寰球人工智能开展的“搭便车者”改变为“奉献者”。梁文锋说,翻新不完整是贸易驱动的,还须要猎奇心跟发明欲。 2、反动性架构:DeepSeek V2 中采取的新型 MLA(多头潜伏留神力机制)架构,把显存占用降到了从前最常用的 MHA 架构的 5%-13%,实现了本钱年夜幅下降。它的推理本钱仅为 Llama 370B 的 1/7、GPT-4 Turbo 的 1/70。 这并不是为了挑起一场价钱战 —— 他们只是在“本钱上略微有点利润”来订价。这种翻新架构持续利用于 V3 跟 R1 模子中。 3、奇特的公司文明跟人才策略:DeepSeek 坚持着一个完整自下而上的构造构造,为研讨职员供给无穷的盘算资本,优先看发明热忱而不是证书。他们的冲破性翻新来自年青的外乡人才 —— 中国外乡的应届结业生跟年青技巧人才,而非海内应聘。 4、努力于开源:只管行业开端趋势于闭源模子(OpenAI 跟 Mistral),DeepSeek 仍努力于开源,并以为开源对树立一个强盛的技巧生态体系至关主要。梁文锋以为,在推翻性技巧眼前,闭源构成的护城河是长久的。 他们的真正代价在于树立一个具有翻新才能的构造。 5、底层盘算挑衅:只管领有充足的资金跟技巧,DeepSeek 也面对来自底层盘算的挑衅跟压力。现在公司还不新的融资打算。梁文锋以为,面对的重要制约要素不是资金,而是高端算力的应用权,这些芯片对练习进步 AI 模子至关主要。 除此之外,采访中的诸多细节也被网友当真咀嚼。 原文中,梁文锋被问道:怎样对待做量化同时做大批基本研发,不烧钱吗? 他答复:一件冲动民气的事,或者不克不及纯真用钱权衡。就像家里买钢琴,一来买得起,二来是由于有一群急于在下面弹吹打曲的人。 海内网友感叹: 这帮人是一群有点幻想化的“技巧狂”,他们深信本人能搞出通用人工智能(AGI),并且他们确切有这个资本跟禀赋。我真是太爱好他们了! 别的也防止不了一些对照: 梁文锋展示出一种完整差别的心态,他们的胜利当之无愧,我也很等待看到他们一次又一次让“OpenAI”认清本人。 固然放眼 AI 范畴的团体开展,可能看到 DeepSeek,对全部人而言或者都是高兴的。 只管我不由得感到他们有点无邪,究竟在贸易化上他们有点“自断后路”。但看到一个团队保持幻想并获得胜利,确切让人感到很快慰。 跟着 R1 的冷艳表态,DeepSeek 正在兑现本人所说的所有。拓宽技巧界限、保持开源、专一于技巧开辟…… 那么,DeepSeek 是怎样走到当初的呢? 用 AI 做量化,再回到 AI 梁文锋本硕均就读于浙江年夜学信息与电子工程学专业。 2008 年,梁文锋结业,开端率领团队应用呆板进修等技巧摸索全主动量化买卖。 事先量化在海内仍是个新颖观点,是否赢利是个未知数。2010 年沪深 300 股指期货推出,量化投资迎来春天。据公然信息表现,梁文锋团队恰是乘上这股春风,很快自营资金超越 5 亿元。 与此同时,深度进修海潮的齿轮开端滚动,人工智能率先在硅谷暴发。 2015 年,梁文锋与校友独特创建幻方量化。仅仅 1 年后,他们就推出了旗下第一个 AI 模子,第一份由深度进修天生的买卖仓位上线履行,应用 GPU 停止盘算。 2017 年,幻方量化声称实现投资战略片面 AI 化。 2018 年,幻方量化建立 AI 为公司的重要开展偏向。 AI 加持下,幻方量化旗下基金报答率远超同期沪深 300 指数。2019 年,资金治理范围冲破百亿元。 2019 年,梁文锋在昔时的金牛奖颁奖典礼上,宣布主题报告《一名顺序员眼里中国量化投资的将来》,这是他少见的公然报告。 报告全文确实充斥“顺序员视角”: 量化公司是不基金司理的,基金司理就是一堆效劳器。人来做投资决议的时间,它是一种艺术,要凭感到。顺序来决议的时间,它是一种迷信,它有最优解。 也是这一年,幻方量化开端年夜范围规划 AI 算力,搭建起“萤火一号”集群。2021 年,“萤火二号”完工。如许的算力基建,成为现在 DeepSeek 疾速奔驰的底层支持。 2021 年,幻方量化成为海内首家冲破千亿范围的的量化私募年夜厂,被称为海内量化私募“四年夜天王”之一。 值得一提的是,在幻方量化的官网上,AI 基本迷信研讨一直盘踞主要地位,包含在年夜模子海潮前。 幻方量化曾表现,多年以来,该公司保持把营收的年夜局部投入人工智能范畴,建立当先的 AI 硬件基本设备,停止年夜范围的研讨,摸索人类未知的神秘。 咱们信任多少乎全部的翻新都是从勇敢实验跟点滴积聚中孕育而来。 2023 年,幻方量化将了局做年夜模子的自力新构造定名为深度求索,并夸大将专一于做真君子类级其余人工智能。 目的不是复刻 ChatGPT,而是研讨跟揭秘 AGI 的更多未知信息。 DeepSeek 的故事也就开端于这一刻。 一个 80 后顺序员在搅动中国量化市场后,实现资金积聚,组建起年青发达的团队,仿佛又回到了他底本的出发点、回到 AI,但发生的能量正在寰球掀起骇浪。 One More Thing 值得一提的是,幻方量化还临时向慈悲机构捐献,官网表露公司员工“一只平常的小猪”团体捐助 1.38 亿元,支撑 15 家慈悲机构的 23 个公益名目,在天下范畴内辅助弱势群体,增进社会的公正跟开展。 爆料新闻称,这个员工就是梁文锋自己。 参考链接: [1]https://www.reddit.com/r/LocalLLaMA/comments/1i6dlvj/inside_deepseeks_bold_mission_ceo_liang_wenfeng/ [2]https://www.threads.net/@yannlecun/post/DFNvN3euNEV?xmt=AQGzPcW8Rr7oXT6-rHIoKzBNL5x2PNnaprvJBL6uIhgoQA
首页
电话
短信
联系