其实,算法误报在实际项目场景中是一个很常见的问题。产生误报的客观原因也是多种多样,绝大部分是跟训练数据集有关,比如训练任务和目标任务的数据分布不一致、训练数据集过少等。
针对这样的问题,行业内通常会重新收集场景数据,采用回炉再造的方式人工进行算法迭代,来满足实际场景应用的需求。
但是这种方式路径较长、沟通繁琐,而且很多项目数据集敏感不能外传,这就导致算法迭代比较麻烦。
基于此,极视角自研了「自训练工具」来解决这些问题,为客户提供灵活、便捷、高效的算法迭代方式。
#什么是自训练工具?
自训练工具是一个面向极星平台私有化部署项目的算法快速迭代工具,为经典机器学习和深度学习提供了从数据处理、预置算法、模型训练、模型评估到模型管理的全链路服务,可以在保护项目数据隐私的前提下,缩短当前算法修复路径,减少客户与开发者沟通和参与的投入成本。
△ 自训练工具全链路服务
自训练工具是基于极视角提供的标准通用模型,叠加客户提供的特定场景下新的数据集,进行模型再训练,从而生产出效果更好的算法。
#自训练工具的优势
✓提供算法模型优化全链路服务,进行多轮模型训练,评估后替换原模型,实现模型优化。
✓提供3种数据接入方式(可以选择极星抓图数据、极星报警数据、本地上传数据)、2种数据清洗方式(包括智能去重、人工调参)和多版本数据集管理(包括训练数据集、测试数据集),灵活开放,操作方便。
△ 自训练工具数据服务
✓提供自训练工具私有化部署方式,现场安装自训练工具,解决网络环境约束以及敏感数据外传的问题。
✓使用生产环境的垂直场景数据集,自训练后的模型更精准适配实际场景,算法减少误报和漏报。
对客户来说,只需要采集一定的垂直场景数据集,无需额外投入专业人力,使用自训练工具便可提高算法准确率,轻松实现算法迭代。除去数据重新标注环节,自训练工具1天内即可完成算法模型优化,节省50%以上的算法优化迭代时间。
极星平台是基于极视角强大技术能力打造的AI应用开发及服务平台,致力于帮助企业客户低成本实现AI与业务的结合,快速完成AI能力的构建。
关于极星平台的更多技术亮点、如何为客户解决AI应用过程中的实际痛点、如何提升AI落地效率,敬请关注「极讲堂」栏目后续推出。
作者:Turbo
极视角产品设计中心
极星平台产品负责人
“算法繁星·智能引擎
数字世界的新底座 ”
「极讲堂」
「极讲堂」是极视角全新打造的技术主题栏目,每期会邀请一位极视角的产品或技术发言人,围绕极市平台、极星平台、极栈平台、极光AI算法盒子、算法商城等核心主题,公开分享其产品逻辑、底层技术、创新应用等背后的故事。技术驱动发展,技术引领未来,极视角将带您领略技术的魅力!