同行谈DeepSeek破圈:对AI发展是利好,不代表其他模型没有机会

admin 2025-02-18 14:44:17 阅读:31 评论:0
DeepSeek破圈后,其他大模型企业怎么看?,2025全球开发者先锋大会(GDC)将于2月21日至23日在上海徐汇举办。2月17日下午,澎湃新闻记者前往人工智能企业商汤科技、大模型创业公司稀宇科技(以下简称MiniMax)探营,并与两家企...
DeepSeek破圈后,其他大模型企业怎么看?,2025全球开发者先锋大会(GDC)将于2月21日至23日在上海徐汇举办。2月17日下午,澎湃新闻记者前往人工智能企业商汤科技、大模型创业公司稀宇科技(以下简称MiniMax)探营,并与两家企业的相关负责人聊了聊。,“DeepSeek的核心优势在于它的上下文理解和深度思考,商汤的模型更多是在多模态上有一定优势,相信在不同的场景,不同的模型能够发挥不同优势。”商汤大装置产品总监刘叶枫认为。,谈及DeepSeek这家“友商”,MiniMax副总裁刘华不吝赞美之词,称DeepSeek在强化学习、算力调配等方面都做得非常有创新。他认为,在顶层研发框架迭代的情况下,需要研发人员对技术变革抱有极致的热情。,“一个模型做得好,不代表其他模型就没有机会。很多友商觉得DeepSeek做得好,自己也主动接入、也愿意用,这是一个非常开放的心态,我觉得这挺好。”刘华说。,位于上海漕河泾开发区的商汤科技大厦内景图  本文图片均由澎湃新闻记者 俞凯 摄,商汤:DeepSeek引爆,对整个AI生态和产业发展来说是利好消息,澎湃新闻记者在探营中了解到,就在2月8日,商汤大装置官宣上架DeepSeek系列模型,企业客户和开发者可在商汤大装置万象平台中,快速部署DeepSeek-V3、DeepSeek-R1等模型,并可享受3个月内1000万tokens免费使用权益。,刘叶枫表示,DeepSeek破圈,更多人使用并把它当作工作流程的一部分,后续可能会产生一系列应用浪潮,对于未来的算力需求会有一个更大的增长空间,无论是政府侧还是业主侧。,刘叶枫介绍2025全球开发者先锋大会商汤科技参会情况,在商汤科技产品总监、小浣熊家族产品负责人贾安亚看来,DeepSeek引发的这一波浪潮主要体现在三点:一是更低的成本,包括一些架构的优化、训练和推理成本的降低,对于产业落地非常关键;第二就是更强的模型能力,主要体现在模型通过长思维链的更强推理能力;第三就是多模态的融合,带来更多实际应用场景的落地,给包括医疗、金融、教育、工业等行业以及辅助编程、智能办公、智能客服和营销等场景带来非常多的应用机会。,“前两年,一些新的AI技术还让大家感觉需要花很多的教育成本,但随着DeepSeek引爆,更多人尝试使用,对于整个AI生态和产业发展来说,都是一个非常利好的消息。最终落在实处的还是客户价值,怎么去服务更多用户。我们也看到,一些开源模型在很多能力上的亮点,我们也希望保持产品的开放性、博众家之长,去接入更多更好的模型。”贾安亚告诉记者。,贾安亚告诉记者,在本周末举行的全球开发者先锋大会上,商汤将会发布在辅助编程、智慧办公方面功能更丰富的代码小浣熊2.0,也会邀请实际用户去展示他们使用小浣熊的实际体验。,MiniMax:一个模型做得好,不代表其他模型就没有机会,位于上海徐汇区的MiniMax是2021年成立的一家规模数百人的大模型创业公司。该公司副总裁刘华告诉记者,今年1月该公司也做了一次大模型开源,开源的是全球首个大规模实现线性注意力机制的模型MiniMax-01系列,其语音模型能够反映出人类的喜怒哀乐,目前已可支持17种语言。,媒体记者在MiniMax探营采访,谈及DeepSeek这家“友商”,刘华不吝赞美之词:“DeepSeek在强化学习、算力调配等方面都做得非常有创新,取得了非常多的进步与发展,所以迅速火出圈。作为AI行业的从业者,我们的感受是,这个行业技术迭代的速度非常快,大模型技术一直保持着每隔几个月就取得重要突破的一个频率,这其中就包括DeepSeek所带来的创新。我们判断,接下来的两三年,大模型的能力还会带来几倍量级的提升。”,不过,刘华同时呼吁,大家千万不能掉以轻心,“竞争非常激烈,千万别说中国大模型已经弯道超车、不再需要关心和支持了,我们还是需要得到大家的呵护。”,他以中国新能源汽车举例说,中国的新能源汽车是从1995年开始起步的,到2024年差不多发展了30年,其间走过了模仿、创新、赶上阶段,目前基本是处于一个超越的阶段,对大模型企业来说,也需要经过这样一个历程。,在采访中,刘华还特别提到了得益于大模型的开源,近期社会各界热衷向DeepSeek“提问”。在他看来,高水平大模型的开源,有助于推动行业的加快发展,能够让大众免费体验到优秀大模型的技术能力,有助于提高AI的渗透力,吸引更多的开发者一起参与大模型的研发。,但他也提到,问答助手还是属于AI大模型比较初级阶段的浅层次应用,只是解决了求知欲的问题,对提高生产力方面作用并不大。“现在的大模型推理能力增强,可以去思考复杂的问题、给出复杂的答案,问它一些特别简单的问题,其实是浪费大模型的能力。其实在很多复杂的场景下,大模型会有更多的用处,也可以对生产力有真正立竿见影的效果。”,刘华同时表示,在顶层研发框架已经迭代的情况下,其实需要研发人员对技术变革抱有极致的热情。所以大家可以看到DeepSeek特别好玩的一点,就是他们不去招募所谓大模型行业的专家学者,招的基本上都是顶多在业界干了一两年或者直接就招博士硕士,这些年轻人对技术变革往往抱有极致的热情。,“MiniMax也一样,我们的研发团队也非常年轻,就是一个90后的天地,大部分人都在35岁以下,好多博士还在读书阶段就过来做实习生,然后一毕业就来公司签约。”刘华说,这次全球开发者先锋大会,公司会请很多智能硬件生产合作伙伴一起展示大模型的应用场景,把自己正在做的事情和创新点展示给大家。,“一个模型做得好,不代表其他模型就没有机会。现在很多友商觉得DeepSeek做得好,自己也主动接入、也愿意用,这是一个非常开放的心态,我觉得这挺好。”刘华表示。,

同行谈DeepSeek破圈:对AI发展是利好,不代表其他模型没有机会

2025-02-18 07:14:00 来源:澎湃新闻

DeepSeek破圈后,其他大模型企业怎么看?

2025全球开发者先锋大会(GDC)将于2月21日至23日在上海徐汇举办。2月17日下午,澎湃新闻记者前往人工智能企业商汤科技、大模型创业公司稀宇科技(以下简称MiniMax)探营,并与两家企业的相关负责人聊了聊。

“DeepSeek的核心优势在于它的上下文理解和深度思考,商汤的模型更多是在多模态上有一定优势,相信在不同的场景,不同的模型能够发挥不同优势。”商汤大装置产品总监刘叶枫认为。

谈及DeepSeek这家“友商”,MiniMax副总裁刘华不吝赞美之词,称DeepSeek在强化学习、算力调配等方面都做得非常有创新。他认为,在顶层研发框架迭代的情况下,需要研发人员对技术变革抱有极致的热情。

“一个模型做得好,不代表其他模型就没有机会。很多友商觉得DeepSeek做得好,自己也主动接入、也愿意用,这是一个非常开放的心态,我觉得这挺好。”刘华说。

位于上海漕河泾开发区的商汤科技大厦内景图  本文图片均由澎湃新闻记者 俞凯 摄

商汤:DeepSeek引爆,对整个AI生态和产业发展来说是利好消息

澎湃新闻记者在探营中了解到,就在2月8日,商汤大装置官宣上架DeepSeek系列模型,企业客户和开发者可在商汤大装置万象平台中,快速部署DeepSeek-V3、DeepSeek-R1等模型,并可享受3个月内1000万tokens免费使用权益。

刘叶枫表示,DeepSeek破圈,更多人使用并把它当作工作流程的一部分,后续可能会产生一系列应用浪潮,对于未来的算力需求会有一个更大的增长空间,无论是政府侧还是业主侧。

刘叶枫介绍2025全球开发者先锋大会商汤科技参会情况

在商汤科技产品总监、小浣熊家族产品负责人贾安亚看来,DeepSeek引发的这一波浪潮主要体现在三点:一是更低的成本,包括一些架构的优化、训练和推理成本的降低,对于产业落地非常关键;第二就是更强的模型能力,主要体现在模型通过长思维链的更强推理能力;第三就是多模态的融合,带来更多实际应用场景的落地,给包括医疗、金融、教育、工业等行业以及辅助编程、智能办公、智能客服和营销等场景带来非常多的应用机会。

“前两年,一些新的AI技术还让大家感觉需要花很多的教育成本,但随着DeepSeek引爆,更多人尝试使用,对于整个AI生态和产业发展来说,都是一个非常利好的消息。最终落在实处的还是客户价值,怎么去服务更多用户。我们也看到,一些开源模型在很多能力上的亮点,我们也希望保持产品的开放性、博众家之长,去接入更多更好的模型。”贾安亚告诉记者。

贾安亚告诉记者,在本周末举行的全球开发者先锋大会上,商汤将会发布在辅助编程、智慧办公方面功能更丰富的代码小浣熊2.0,也会邀请实际用户去展示他们使用小浣熊的实际体验。

MiniMax:一个模型做得好,不代表其他模型就没有机会

位于上海徐汇区的MiniMax是2021年成立的一家规模数百人的大模型创业公司。该公司副总裁刘华告诉记者,今年1月该公司也做了一次大模型开源,开源的是全球首个大规模实现线性注意力机制的模型MiniMax-01系列,其语音模型能够反映出人类的喜怒哀乐,目前已可支持17种语言。

媒体记者在MiniMax探营采访

谈及DeepSeek这家“友商”,刘华不吝赞美之词:“DeepSeek在强化学习、算力调配等方面都做得非常有创新,取得了非常多的进步与发展,所以迅速火出圈。作为AI行业的从业者,我们的感受是,这个行业技术迭代的速度非常快,大模型技术一直保持着每隔几个月就取得重要突破的一个频率,这其中就包括DeepSeek所带来的创新。我们判断,接下来的两三年,大模型的能力还会带来几倍量级的提升。”

不过,刘华同时呼吁,大家千万不能掉以轻心,“竞争非常激烈,千万别说中国大模型已经弯道超车、不再需要关心和支持了,我们还是需要得到大家的呵护。”

他以中国新能源汽车举例说,中国的新能源汽车是从1995年开始起步的,到2024年差不多发展了30年,其间走过了模仿、创新、赶上阶段,目前基本是处于一个超越的阶段,对大模型企业来说,也需要经过这样一个历程。

在采访中,刘华还特别提到了得益于大模型的开源,近期社会各界热衷向DeepSeek“提问”。在他看来,高水平大模型的开源,有助于推动行业的加快发展,能够让大众免费体验到优秀大模型的技术能力,有助于提高AI的渗透力,吸引更多的开发者一起参与大模型的研发。

但他也提到,问答助手还是属于AI大模型比较初级阶段的浅层次应用,只是解决了求知欲的问题,对提高生产力方面作用并不大。“现在的大模型推理能力增强,可以去思考复杂的问题、给出复杂的答案,问它一些特别简单的问题,其实是浪费大模型的能力。其实在很多复杂的场景下,大模型会有更多的用处,也可以对生产力有真正立竿见影的效果。”

刘华同时表示,在顶层研发框架已经迭代的情况下,其实需要研发人员对技术变革抱有极致的热情。所以大家可以看到DeepSeek特别好玩的一点,就是他们不去招募所谓大模型行业的专家学者,招的基本上都是顶多在业界干了一两年或者直接就招博士硕士,这些年轻人对技术变革往往抱有极致的热情。

“MiniMax也一样,我们的研发团队也非常年轻,就是一个90后的天地,大部分人都在35岁以下,好多博士还在读书阶段就过来做实习生,然后一毕业就来公司签约。”刘华说,这次全球开发者先锋大会,公司会请很多智能硬件生产合作伙伴一起展示大模型的应用场景,把自己正在做的事情和创新点展示给大家。

“一个模型做得好,不代表其他模型就没有机会。现在很多友商觉得DeepSeek做得好,自己也主动接入、也愿意用,这是一个非常开放的心态,我觉得这挺好。”刘华表示。

版权声明

本站属个体站点,非官方网站。本站的文章内容由系统自动采集,不保证其真实性,敬请自行核实广告和内容真实性,并请谨慎使用。本站和本人不承担由此产生的一切法律后果!如有侵权,联系QQ:1755043837

分享:

扫一扫在手机阅读、分享本文

热门文章
  • 2024 年小学生时事新闻:不容错过的

    2024 年小学生时事新闻:不容错过的
    作为一名小学生,了解时事对于开阔眼界、增强社会责任感非常重要。以下是2024年不容错过的时事要闻: 中国探月计划再创佳绩 2024年,中国计划发射嫦娥六号探测器,着陆在月球背面,带回月球样品。 这将是人类首次从月球背面采集样品,有助于科学家们进一步了解月球的起源和演化。 5G技术全面普及 5G技术以其超高速率和低延迟,将彻底改变我们的生活方式。 在2024年,5G网络预计将覆盖中国大部分地区,为智能家居、自动...
  • 陆军政委陈辉晋升上将新晋升,成为共和国第一位在军改后由少将直接晋升至上将的军官

    陆军政委陈辉晋升上将新晋升,成为共和国第一位在军改后由少将直接晋升至上将的军官
    近日,解放军重要人士调整,陆军政委陈辉晋升上将军衔,成为共和国第一位在军改后由少将直接晋升至上将的军官。 陈辉1963年出生,河南商水人,早年毕业于解放军南阳陆军学院合成指挥专业,历任陆军第81集团军副军长兼参谋长、副司令员,第78集团军军长,中部战区陆军司令员等职。2022年4月,陈辉担任陆军政委。 在担任中部战区陆军司令员期间,陈辉大力推进战区建设和改革创新,完善实战化训练体系,培养了一批实战化新型军事人才。他注重部队政治思想工作,思想政治建设成效显著。在...
  • 江森任中建南方投资有限公司党委书记 董事长

    江森任中建南方投资有限公司党委书记 董事长
    据中建南方投资消息,12月18日,中建南方投资有限公司召开干部大会,宣布领导班子职务调整: 周勇同志不再担任中建南方党委书记、执行董事职务; 杨昌德同志不再担任中建南方党委副书记、总经理职务; 任命江森同志任中建南方党委书记、董事长。 本次职务调整是根据党中央和国务院关于国有企业领导班子建设的有关要求,并经集团公司党委同意后进行的。新任职的同志将带领中建南方投资有限公司继续深化改革开放,创新发展,为推动我国经济社会发展作出...
  • 传播正能量之光,让生命之花绽放无际

    传播正能量之光,让生命之花绽放无际
    正能量就像一束明媚的阳光,照耀着我们前行的道路,驱散阴霾,激发希望。当我们传播正能量时,我们就成为了黑暗中的一盏明灯,指引他人走出迷茫,拥抱光明。让正能量之光洒遍世界的每一个角落,让生命之花绽放出无际的美丽。 正能量的意义 正能量是一种积极乐观的人生态度,它包括感恩、宽容、善良、希望和坚强。它是我们面对逆境时最重要的精神支柱,它能帮助我们克服困难,实现梦想。正能量不是虚无缥缈的空想,而是一种切实可行的力量,它能改变我们的生活,让我们的生命更加美好。 传...
  • 18. 正能量的灯塔:点亮通往辉煌未来的道路

    18. 正能量的灯塔:点亮通往辉煌未来的道路
    在人生的旅途中,难免会遇到迷茫和挫折。在这时,我们需要一盏明灯,指引我们前行的方向,给予我们坚持下去的动力。正能量就是这样的灯塔,它照亮着我们的内心,点燃我们的希望,引领我们走向辉煌的未来。 正能量的来源 正能量来自多个方面,包括: 积极的心态:相信自己的能力,相信明天会更好,即使在逆境中也能保持乐观。 良好的环境:周围的人和事物对我们的情绪和心态有很大的影响。选择积极向上的人和环境,可以给我们带来正能量。...