记者从国家数据局获悉:国家数据局指导合肥、成都等7个城市建设数据标注基地,先行先试探索数据标注产业进步经验,截到今天年上半年,7个数据标注基地建设数据集524个,服务大模型163个。
优质数据集是经过采集、加工等数据处置,可以直接用于开发和练习AI模型,可以有效提高模型性能的优质数据集合。
国家数据局副局长余英表示,国家数据局全方位加速优质数据集建设和应用落地,组织拓展生态培育专项行动。拓展优质数据集典型案例寻求和示范推广,挖掘医疗、工业、交通等重点范围标杆实践;
按期举办技术交流活动,围绕数据标注、合成、优质数据集建设办法论等拓展深度研讨;
搭建正常的状态供需对接平台,促进数据供给方、技术提供方、场景应用方精确匹配。
下一步,国家数据局将着力塑造“数据标注+优质数据集+模型+应用场景+市场化价值化”的闭环生态,推进数据要点市场化配置改革和“AI+”行动同向发力、同频共振。(王云杉、张玲)
来源:人民日报