五指小说
会员书架
首页 > 都市小说 > 穿越:2014 > 第275章 技术强势就是为所欲为

第275章 技术强势就是为所欲为(1 / 2)

上一章章节目录 加入书签 下一页
好书推荐: 葬神  离婚后的我开始转运了  道断修罗  奥特曼之我泰罗真不是童工  我以剑道证超凡  女官锦衣卫  备前宰相  山海为龙  位面外卖哥  安然居 

严格来讲的话,同样是标注数据也是可以区分为专家标注和众包的。

所谓的“专家标注”也不是真的专家去进行标注。

“数据标注”听起来似乎蛮高大上的,但实际上呢?

进行数据标注过程往往非常复杂,涉及到数据量特别多的时候,对人工劳动力会有很高的要求。

虽然不能说低端吧,但这种机械而繁复的工作至少跟高端是没啥关系的,砖家教授肯定是不会去干这活的。

所谓的专家标注一般都是由苦逼的算法工程师进行兼职。

或者由专门的算法数据标注员进行标注。

所谓的数据标注员是一种新兴职业。

前世,随着大数据以及人工智能时代的到来,为了应对数据标注的工作在互联网上出现了一种新型职业——数据标注员。

数据标注员的工作是使用相应的工具从互联网上抓取、收集数据,包括文本、图片、语音等等。

然后对抓取的数据进行整理与标注。

这些数据标注员工具体的工作流程一般很明确:

首先,标注人员经过培训,确定需要标注的样本数据以及标注规则;

而后,根据事先安排好的规则对样本数据进行打标;

其次,对标注完以后的结果进行合并。

而算法数据标注员稍稍有别于一般的数据标注员。

相比于一般的数据标注猿,算法数据标注猿往往在完成以上的步骤之后。

还要通过标注的数据喂模型进而调试模型。

尽管工作流程只是多了这一步,但专业的算法数据标注员依旧是凤毛麟角。

从先前罗列的任务也可以看出算法数据标注员的任务不仅仅是数据标注。

往往还需要根据标注的数据进一步评估算法模型。

如此一来很多时候对书记标注员的要求是这些人不光要进行数据标注。

还得懂相应的算法。

同时满足这两个条件的人很多时候完全是凤毛麟角。

正因为这种专业标注的人员很少。

往往专家级标注只能够胜任小量级的数据。

对于大规模数据标记和超大规模数据的标记任务想要依靠专家标记很多时候只能是力不从心。

对于大规模数据标记和超大规模数据标记往往只能寻求众包了。

众包模式是将零散的个人(包括兼职)、小标注团队,整合到平台上,完成一个完整项目的服务模式。

这种模式的主要优势成本很低,且比较灵活。

尽管前世机器学习长期所致力于的工作就是能够以众包数据或者干脆是无标数据取代专家标注。

但真要问专家标注和众包数据哪个受欢迎。

那自然是前者。

这种情况下夸大标注数据中专家标注所占的比例很容易收获到更高的溢价。

听起来似乎很奸商。

但也仅仅只是听起来而已。

如果林灰所大肆赞美的标注数据和现在的专家标注水平真的区别很大的话。

那林灰吹破大天也没用。

毕竟打铁还需自身硬。

林灰既然敢宣称标注数据中专家标注所占的比例很高自然有底气。

怎么说呢?

往后几年即便是一些非专家标注的数据,在行业标准化、规范化的情况下。

很多时候,就算是众包的数据也未必比现在的行业尚未完全标准化以及规划化的专家标注的水平差。

就算林灰拿往后几年的非专家标注数据去忽悠人。

想来这个时空也会有人去买账。

没办法,技术强势就是可以为所欲为。

上一章章节目录 加入书签 下一页
书单推荐: 师姐以身传功,我无敌了 快穿:黑心花打脸虐渣手册 宛如昨 与女经理合租的日子 恶毒女配被反派大佬护在身后了 变强从养蚂蚁开始 千机:废物王爷与女将军 穿进恶霸窝,她靠种田逆天改命! 都市:无敌后,我成了最强纨绔 我的十大邪王面具
返回顶部