上海AI生态,大模型评测与场景落地的双轮驱动

   日期:2025-03-03     作者:r9t9x       评论:0    移动:http://www.kub2b.com/mobile/news/2925.html
核心提示:“站在浦江畔的这个老厂房里,我仿佛听到了人工智能引擎轰鸣的声音,它不仅是技术的革新,更是新质生产力的核心动能。”2025年2

“站在浦江畔的这个老厂房里,我仿佛听到了人工智能引擎轰鸣的声音,它不仅是技术的革新,更是新质生产力的核心动能。”2025222日下午,在西岸艺术中心A馆举办的2025全球开发者先锋大会(GDC)浦江AI生态论坛上,来自上海人工智能实验室的韩冰这样开场。

AI问鼎诺贝尔奖、DeepMindAlpha系列”的多领域突破,凸显了AI从辅助工具向科学革命引擎的转型2024年被誉为“AI4S破圈元年”此次生态论坛期间,上海人工智能实验室青年科学家白磊发布了AI for Science攀登者行动计划》(简称AI4S计划)白磊认为,未来,随着AI4S在数据驱动(AI for Data)、计算优化(AI for Computation)与创新激发(AI for Innovator)上的深化,其有望重塑人类认知边界,成为AI产业的高价值增长点。

十年前,AlphaFoldAI破解蛋白质折叠难题,让世界第一次意识到AI不仅是工具,更是科学发现的新感官。上海人工智能实验室青年科学家白磊表示,当前AI4S仍面临学科壁垒、组织断层与转化迟滞的挑战,而实验室的应对策略是发起一场针对科学范式的“供给侧改革”。

AI4S计划聚焦三大创新方向:一是突破性科学方向,推动AI专家与科学家的跨界协作;二是共性技术问题,沉淀AI工具与平台;三是产业标杆应用,加速技术落地。计划面向全球开放申请,提供数据资源、算力支持与科研经费,首批通知将于3月中旬发出,并采用滚动机制持续赋能。这一模式不仅突破了传统科研的单兵作战局限,还通过跨学科协作与资源整合,孕育颠覆性成果的可能性。

然而,挑战在于如何平衡资源投入与成果转化效率,这需要全球开发者社区的共同参与。

“如果大模型是驶向通用人工智能的‘星舰’,那么评测体系就是它的‘导航仪’与‘安全带’。”浦江AI生态论坛上,上海人工智能实验室双聘研究员翟广涛在发布“以人为本”大模型评测体系时,提出了这一比喻。当前,大模型评测面临标准割裂、场景脱节与价值失焦的困境,高分低能的现象频现。

为此,上海人工智能实验室基于OpenCompass司南评测平台,推出以人为本的评测框架,覆盖人工智能、法律、金融等多个领域,从问题解决能力、信息质量与交互体验三大维度进行多轮人机协作评估。

评测结果显示,Grok 3DeepSeek R1在部分领域超越OpenAIo3 mini,例如Grok 3在金融与自然科学、DeepSeek R1在教育与自然科学表现突出。这一结论不仅为模型优化提供了洞见,也揭示了大模型能力分化的趋势。翟广涛强调,未来评测将保持开放性,通过中立科学的基准促进AI健康发展。

从行业视角看,大模型评测正从“实验室竞技”转向“社会适应性”评估。以人为本的理念意味着,评测不再仅关注技术参数,而是聚焦模型在真实场景中的实用性与伦理价值。

2025年,随着垂类应用的深入,这一趋势将推动大模型从通用能力向专业化、场景化演进,同时倒逼开发者关注安全与可靠性。

“独行者速,众行者远。”上海人工智能实验室生态战略与开源中心负责人许劭华在解读《浦江AI生态共赢计划》时,强调了协作的重要性。

该计划以开放共赢为核心,围绕数据语料、人才智库、评测标准与解决方案能力四大要素,构建技术-产业闭环。首批16家生态合作伙伴与10家大模型语料数据联盟新成员的授牌,标志着上海AI生态的全面起势。

许劭华认为,高质量语料是AI发展的燃料,实验室通过OpenDataLab平台开源了“书生万卷”“丝路”等语料库,解决行业数据痛点。上海数据集团的高晓丽进一步补充,数据基础设施建设正加速语料生产与流通,区块链技术与敏捷治理为数据安全提供保障。算力方面,上海智能算力科技的张宏洲透露,其智算云平台通过分布式模式降低开发者成本,2025年将迎来推理应用的爆发。

显然,AI生态的繁荣依赖技术、数据与场景的三位一体耦合。上海以“模速空间”为代表的产业社区,已形成千亿基金与创新载体的协同效应。未来,生态飞轮效应将加速技术迭代与产业落地,尤其在医疗、建筑、工业等垂类领域,AI+场景的标杆应用将成为增长引擎。

上海人工智能实验室主任助理、领军科学家乔宇预测,2025年多模态智能涌现、科学智能突破与具身智能范式固化将成为焦点。他提出“通专融合”理念,通过通用大模型与专用技术的结合,破解成本与效率瓶颈。实验室与央视合作的《千秋诗颂》项目,展示了AIGC如何降低创意成本并提升产业价值。

因为在电视上能播放的动画片一集制作成本在10-20万,如果每一集都是一个风格一定是超标的,正是因为有了我们这样更好的AIGC的技术,可以大大降低成本,从而扩大了创意的空间。乔宇说,

上海人工智能实验室青年科学庞江淼则分享了面向通用具身智能“虚实贯通”的路径对具身智能来说,本质上存在着数据金字塔,最上面是有面向机器人的真实的数据,其实是需要采集。这里面也会存在通用的数据,或者专用的数据。庞江淼认为,我们可以通过仿真器的方式产生大量的仿真的数据,以及在互联网上开源的一些并没有在这个空间进行的机器人数据或者视频数据。越往上的数据,其实距离机器人使用的作用是越大的,但数量也越小,越往下的数据其实并不能被直接应用,机器人的数量又很多,怎么样能够共同用这样的一个方式去解决这个问题?其实实验室走的就是Real2Sim,把真实环境的环境快速重建到整个仿真器里面,通过仿真器里面产生大量的数据,让机器人在仿真环境中进行训练,对机器人的能力进行评测,最后形成一个模型部署到真实的机器人上,形成真的具身智能的大模型。

人形机器人通过强化学习与外骨骼驾驶舱技术,已能在复杂地形中执行任务,成功率达80%以上。庞江淼预测,具身智能将在2025年迎来范式收敛,逐步走进千家万户。

上海人工智能实验室青年科学家何聪辉的《MinerU:大模型时代的文档语料生产新引擎》则瞄准数据痛点。MinerU工具半年内获2.5GitHub星标,支持复杂文档提取与转换,填补了私域数据到大模型应用的“最后一公里”。其开源策略与小语种语料库“万卷·丝路”的发布,显示了数据引擎对模型优化的关键作用。

未来,多模态与具身智能将推动AI从数字空间走向物理世界,而数据质量的提升将成为能力跃迁的基石。2025年,推理能力、场景扩展与监督学习方式的创新,将进一步释放大模型潜力。

AI的产业化路径如何走?上海国投先导私募基金管理有限公司副总经理何苗介绍,其管理的225亿人工智能基金通过“三个一”(唯一、第一、之一)与“五力”(创新策源、成果转化等)策略,支持上海AI生态建设。

“我们在整体人工智能生态,上海是有一个自上而下的整体战略规划的。我们目前上海已经形成了‘4+X’融合创新载体,从徐汇滨江到浦东的张江,闵行马桥、临港新片区等,各自都有各自的细分赛道和关注的要点,经过过去两年的智能空间载体的建设,我们现在上海也形成了‘一软一硬、一西一东’产生方面非常有特色的布局。”何苗说。

上海宝信软件人工智能所副所长张洋分享了钢铁大模型如何通过“五位一体”架构,实现从生产到决策的全链条智能化,解决无人化作业与故障诊断难题。“大模型在钢铁落地的时候,我们能看到要运用这些技术去看火、看渣、看缺陷,看钢铁钢板的编号,所有的现场无人化作业、安全化作业,还有生产的状态判断交给模型。这个过程是非常重要的,随着模型的可用度越来越高,我们的这个步骤会越来越成熟,交给模型。我们现场复杂的和比较脏的,还有不太安全的位置,将由这些人工智能模型为我们的现场生产保驾护航。

 
特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

举报收藏 0打赏 0评论 0
 
更多>同类最新资讯
0相关评论

相关文章
最新文章
推荐文章
推荐图文
最新资讯
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号