
2026年1月18日沪深配,由中国建设监理协会主办的工程监理行业成果发布大会(2025)在山东济南圆满落幕。本次大会汇聚行业领导、专家、各类获奖代表等核心力量,以展示优质成果为核心,凝聚行业高质量发展的共识。

会上,上海建科咨询集团党委副书记、总裁夏冰作了“盈科·绳墨”工程监理行业大模型测评集Norma-MESBench 1.0首次发布的主题报告,分享该测评集的研发理念与行业价值。

Norma-MESBench 1.0是上海建科咨询集团打造的国内首个监理行业万题规模的大语言模型测评基准——它填补了监理领域专属AI大模型测评基准的空白,能用科学、量化的方式帮企业判断AI大模型在监理各专业的知识掌握程度,既是上海建科咨询集团人工智能技术落地的关键成果,更是行业放心用AI、选对AI的实用指南。
该测评集项目从监理行业的角度拆分了含专业技术、通用综合、特色场景三大板块和多个层级的“全维度测评框架”,采用“人工+大模型辅助”的混合模式构建了超万条测评数据,再经格式标准化、去重算法和多轮人工复核等流程进行题目质量控制。为确保测评过程的便捷性、科学性与鲁棒性,项目采用了“多层级加权评分”“裁判模型评审组”等算法实现全流程自动化、标准化,为行业提供了统一、规范、可用的大模型监理专业能力测评框架。

该测评集目前完成了17款主流通用大模型在监理工作场景的能力测评和分析,为相关企业和从业人员提供了专业、精准的大模型在工程监理领域的能力评估,助力企业科学选择适用的AI大模型。
为构建开放和可持续的行业AI生态,上海建科咨询集团已将该项关键成果进行了开源发布,首发当日在ModelScope项目显示下载量已超过千次。期待与更多企业和科研机构携手,进一步推动监理行业人工智能技术的健康、快速发展。
本次测评集不仅是工程监理行业大模型测评体系关键技术成果的首次发布,更是深化“人工智能+”战略在工程建设领域落地的关键一环。随着人工智能技术的广泛应用,工程监理行业将迎来更高质量、更可信赖的智能化转型新阶段。
举报 相关阅读
打造国际开源之都!上海将发布国内首个面向海外的开源平台上海提出通过3至5年努力,打造1~2个具有国际影响力的开源社区,孵化200个以上优质开源项目,集聚超300万全球开发者。
217 2025-12-25 20:13
华为周跃峰:中国存储产业内外承压,但依然有望全球争先华为认为,数据存储有希望成为中国在全球科技领域的第二张名片。
7 445 2025-12-03 14:06
星汉大模型落地提速,大华股份以场景化大模型重构增长逻辑 104 2025-11-27 14:34
Kimi杨植麟称“训练成本很难量化”,仍将坚持开源策略每一张算力卡都被用到了极致。
147 2025-11-11 17:09
“翻译界哈佛”倒闭:有学生哭了两晚,AI冲击下译员何去何从?当“翻译界哈佛”都扛不住行业变革的冲击沪深配,翻译从业者早已站在了分岔路口。
726 2025-11-11 08:08 一财最热 点击关闭亿腾证券提示:文章来自网络,不代表本站观点。