当前位置:产业 > 

用“菁准数据”创造数据仓库的智能搬运工

发布时间:2020-09-02 20:59:43|来源:中国周刊|作者:侯智勇

自人工智能入选“2017年度中国媒体十大流行语”以来,其已逐步深入应用到医疗、天文、工业基建等各个重大领域。随着当下各种数据的激增,人工智能在数据采集和标注方面发挥着越来越重要的作用。基于当今社会科学发展的大背景,在“大胆假设、小心求证”的理念下推出“菁准数据”项目,旨在做全国人工智能企业数据优质服务商。

数据采集快速“菁准”,数据质量稳定输出

当下市场上的数据采集与标注常常出现数据质量参差不齐、数据获取困难且价格高等多重问题。传统的解决方案是通过爬虫手段进行网络数据采集,将采集下的数据由AI工程师进行标注。其往往导致采集样本多样性不足,数据标注成本高,数据标注处理效率低等问题。针对市场痛点,“菁准数据”根据数据采集做出数据集后再对数据进行标注的方式,即通过将数据进行有效拆分,在达到省时省力省钱的同时,有效保证数据产量、质量的稳定输出。

其中在数据采集方面,主要采用网页数据采集系统,打造线上自动化的数据采集器,可视化操作,一键自动采集,从而能够大面积解决网络数据抓取问题。同时利用数据采集小程序,基于图片相似度算法(感知哈希算法),基于RNN神经网络的音频降噪算法等用于不同场景的图像、语音等数据采集,方便快捷,可快速大量完成一般性数据采集任务。除此之外,又以围绕高校密集型人群场所为核心,建立“采集小站”的模式完成较高难度的定制化数据采集任务。计划初期以实际项目为合作入口逐渐积累不同行业资源,最终实现全行业覆盖,以构建“行业”到“AI”双向互赢的桥梁策略,完成行业内数据采集任务。

在数据标注方面,充分发挥众包模式的优势,让用户可以在数据标注平台快速、低成本地完成数据标注任务,发展初期在保证数据产量质量稳定输出的同时,可以全周期完成高难度的标注任务。

线上与线下营销结合,打造营销方式多样化

“精准数据”的推广主要通过线上营销与线下营销相结合的模式,在打造营销模式多样化的同时扩大其品牌影响力。其中线上营销主要通过“官微+微信公众号”的模式,专业媒体如网易新闻、头条新闻等,另外通过百度推广等多种线上营销媒介来扩大影响力。同时结合线下营销,如与AI垂直领域国际孵化器建立合作,实现“菁准营销”,组织各类AI论坛沙龙,商务上门拜访,与AI企业进行面对面商谈,参加展会扩大品牌知名度等等,在扩大知名度的同时及时了解行业信息。

智能语音切入为主,拓展消费目标领域

目前“精准数据”主要以智能语音企业为主要切入口,同时拓展至金融、教育、医疗、家庭家居、无人驾驶、内容审核等众多领域。主要根据项目需求,专门为企业独家定制数据方案,关于公司所自营的数据集,企业客户可购买该数据的共享使用权,同时也可以买断数据版权。截至目前向巳科技已与国内第一大语音商科大讯飞、国内第二大语音商思必驰、网易网络有限公司等多家知名企业进行合作。

关于企业未来的规划,核心团队人员表示预计2020年资金流水将达到2600万,公司目前的运营基地主要分布在成都、海南和云南,届时将完成全国20处运营基地的布局,并进行众包平台AI化研发,通过高新企业雏鹰企业认定等。未来,“菁准数据”将继续利用人工智能创造数据仓库的智能搬运工。(郑应松)



责任编辑:杨文博 校对:杨文博

中国周刊官方微博

官方微信公众号

Top