2025年2月25日,香港生成式人工智能研发中心(HKGAI)发布HKGAI V1大模型,标志着香港首次拥有本土化训练的人工智能基础设施。该模型基于DeepSeek 671B架构实施全参数微调,通过持续增量学习与强化学习机制,成功将香港本地知识库与价值体系注入模型底层,形成支持粤语、英语和普通话的三语交互能力。技术实现路径上,研发团队攻克了大规模参数模型本地化训练中的并行计算优化、多模态数据处理等关键技术,构建起覆盖香港法律体系、行政流程、文化语境的专属知识图谱。
特区政府的战略布局在此次突破中起到关键作用。自2023年起,香港先后投入30亿港元资助计划,建设人工智能超算中心,并在科学园与数码港形成聚集超800家人工智能企业的创新集群。HKGAI V1的研发直接受益于InnoHK创新香港研发平台支持,其应用场景设计紧密贴合政府数字化转型需求,已实现会议纪要生成、法律条文检索、政策文件起草等12类政务场景覆盖,目前约70个政府部门参与系统测试,预计每年可节省行政工时超50万小时。
语言文化适配性是该模型区别于其他区域模型的显著特征。通过构建包含香港判例法、粤语方言语料、繁体中文语境的训练数据集,HKGAI V1在中文场景下的意图识别准确率提升至92.7%,较通用模型提高18个百分点。这种本地化优势在跨境服务场景尤为突出,模型可自动识别内地简体中文与香港繁体中文的语义差异,同步保持与英语法律术语体系的无缝对接,为粤港澳大湾区规则衔接提供技术支撑。
研发路径选择体现出香港在人工智能领域的独特定位。不同于完全自主训练基础模型的技术路线,HKGAI选择对DeepSeek架构进行深度改造,既保留原始模型的通用智能水平,又通过参数微调实现价值对齐与文化适配。这种”嫁接式创新”策略使研发周期压缩至9个月,较完全自主训练缩短60%以上,同时确保模型在华人文化圈的技术兼容性。香港科技大学团队开发的强化学习框架,成功将《基本法》原则、香港司法伦理等要素编码为模型约束条件,形成符合”一国两制”框架的价值引导机制。
产业生态构建层面,HKGAI V1开创了政府-学界-企业协同的新范式。模型接口已向数码港入驻企业开放测试,支持金融合规审查、跨境贸易文件转换等商业场景开发。香港金管局正在评估将该模型应用于反洗钱监测系统的可行性,初步测试显示可疑交易识别效率提升40%。对于中小型科创企业,该模型提供经过合规处理的脱敏训练数据,降低人工智能应用开发门槛,预计将催生超过200个垂直领域解决方案。