织梦CMS - 轻松建站从此开始!

软件开发|软件定制|设计软件|APP软件-沈阳汇海软件公司

当前位置: 主页 > 行业动态 > 中小企业 >

数据成本是否会将AI创企扼杀在摇篮中?

时间:2018-12-04 16:39来源:软件公司 作者:软件定制 点击:
数据逐步成为AI创企的“金钟罩铁布衫”:初创企业收集的数据越多,就越能训练出更好的AI模型,使得新的市场竞争者难以与之匹敌。然而,这些数据并非免费获取,许多AI创企认为,

猎云网(微信号:ilieyun)】11月14日报道(编译:张璐璐)

猎云网注:本文的作者Ivy Nguyen是Zetta Venture Partners的投资者,曾为NewGen Capital的初级助理,并在ImageH2O治理创业减速器项目。本文中,作者基于以后数据爆炸时代的配景,讨论了数据对初创企业的重要性,并从数据搜集、存储、治理、建模等各个历程中阐发本钱成绩,同时提出了一些能够浪费本钱的方法。

目前,数据逐渐成为AI创企的“金钟罩铁布衫”:初创企业搜集的数据越多,就越能训练出更好的AI模型,使得新的市场竞争者难以与之匹敌。但是,这些数据并非收费获取,许多AI创企以为,这笔分外的用度大大腐蚀了他们的利润。随着工夫的推移,这些公司能够希望降低在数据上的投入,但目前尚不清楚如何预测这种状况呈现的工夫,以及降低至何种水平,这就添加了公司对将来增上进行建模的难度。

在软件创企中,产物开发用度在损益表上归属于研发本钱,而AI创企则将数据本钱作为销售本钱(cost of goods sold,COGS)的一部门,后者这种做法有助于企业掘客扩展范围同时降低本钱的机遇,从而进步利润率。

上面的数据价值链流程图显示了大少数AI创企获取和运用数据的方法。首先,企业将根底现实的片段作为原始数据停止记载。企业可将原始数据存储在某处,然后建立流程或途径停止维护和拜候。在运用于AI模型之前,企业需求对数据停止标注,以便AI模型施行处置惩罚每个数据点的行为。随后,训练有素的模型接纳数据并发生反应,企业便可以运用这种反应来执行驱动终端用户某种行为的操纵。该历程可以分为三个差别的步调:获取数据、存储数据和为了训练模型而标注数据。每一步都市发生相应的本钱。

tu2.jpg

数据收罗本钱

在一切的数据价值链中,任何传感器(无论是物理设备照旧人类)在搜集原始数据时,首先需求捕获对理想的观察。在这种状况下,数据收罗的本钱未来自于传感器的创立、分派和操纵。假如该传感器是一种硬件,企业必需思索质料和制造的本钱;假如传感器是人,则本钱来自于人员的招募以及提供他们制造和记载视察后果所需的东西。凭据笼罩范畴的差别,企业能够需求领取少量的用度来漫衍传感器。不但如此,在某些用例中还能够需求停止高频率的数据搜集,这也能够会添加人工和维护本钱。例如,受众丈量公司尼尔森(Nielsen)就需求负担上述一切本钱,由于它既提供收视率搜集盒,也需负担获取到场者电视节目寓目状况的答应费。这样一来,随着笼罩范畴越来越遍及,尼尔森的数据就越有价值,范围经济也就自但是然降低了单元数据收罗本钱。

tu3.jpg

在某些用例中,企业向终端用户提供治理事情流程的东西(例如,自动电子邮件呼应生成器),将他们捕捉的数据存储在他们的事情流程中,或许视察他们与东西的交互并将其记载为数据,从而将数据收罗的事情和本钱转移给终端用户。假如企业选择收费漫衍这些东西,那么数据收罗的本钱就将是获取用户的本钱。或许企业可以选择对事情流东西停止免费,这种方法能够会减慢和限制客户接纳率,从而在抵消数据收罗本钱的同时增加数据收罗,详细的降低和限制水平将取决于企业对该东西的订价。

例如,我们公司的投资组合之一,大数据公司InsideSales为销售代表提供了一个可直接与销售线索建立联络的平台。在销售代表运用的历程中,平台会自动记载互动的相关数据,例如工夫、形式、其他元数据,以及该销售渠道中的销售线索能否有停顿。这些数据将被运用于AI模型的训练,从而计算沈阳网站设计出联络潜在客户最佳的通讯工夫和通讯方法。在这种状况下,随着越来越多用户入驻该平台,网络效应就有能够会进步东西的适用性,从而降低获取用户的本钱。

别的一种方法是,在另一个实体曾经建立了数据搜集渠道的状况下,确保建立战略同伴干系可以进一步降低本钱。例如,我们的另一家公司Tractable接纳计算机视觉来完成汽车保险调治器的自动化。该公司目前正与几家业内精彩的汽车保险公司互助,努力于研发获取受损汽车图像的技术。除此之外,我们无需使车主下载使用步伐,从而浪费了使用步伐推行所需的本钱。

存储和治理本钱

在数据存储和拜候方面,初创企业也面临着一个本钱成绩。除了数据搜集之外,企业能够还需求客户提供其他相关数据来富厚模型。由于许多行业近期才逐渐完成数字化,因而任何拥有企业所需数据的潜在客户都不容小觑。为了获取这些数据,企业能够会在低利润率的数据预备事情中耗费少量的人力。

tu4.jpg

别的,假如数据漫衍在差别的零碎和孤岛中,那么企业能够需求耗费少量的工夫来构建各个集成,从而使模型完全正常运转。有些行业围绕全体式和异质性技术堆栈建立,使集成很难在客户之间反复运用。假如无法获取集成办事提供商,那么这家AI创企很快就能够发明本身堕入了这样的泥潭:只要为每个新客户构建定制集成,才气摆设其AI零碎。数据的构造方法也能够因客户而异,这就要求AI工程师耗费分外工夫对数据停止范例化或将其转换为尺度化形式,从而使用AI模型。企业可以接纳建立大众集成库的要领降低本钱,由于它可以在新客户中被反复运用。

训练本钱

大少数建立AI模型的要领都需求对数据停止标注,这对AI创企来说是最大的和最可变的本钱之一。假如这些示例复杂明了或是浅显易懂,内行沈阳网站建设人就可以停止标注。例如,在图片中画一些苹果,然后在一切苹果四周画一个框,即可标注为外包劳务办事。

但有时,正文需求更多的专业知识和经历,例如凭据视觉线索来确定苹果的质量和成熟度,或许判别石油钻机上的一小块锈斑能否具有风险。对付这种更专业的休息力,企业能够需求建立一个高薪的外部专家标注团队。凭据企业的标注方法,能够还必需构建本身的标注事情流东西,虽然Labelbox等公司目前曾经开端提供此类东西。

tu5.jpg

在某些AI使用步伐中,终端用户会是最无效的标注器,企业可以经过设计产物来加重标注本钱,这样用户就可以在与产物交互时停止数据标志。例如,Constructor提供针对电子商务的人工智能网站搜索,视察用户实践点击和购置每个产物的搜索词,使这些网站可以优化搜索后果从而取得更高的销售额。这种标注不成能经过外包或专家搜索办事停止人工操纵,并且这种方法大小节约了Constructor潜在的巨额标注本钱。

即便遭到了高精度的训练,但当模型无法确切地解释一项新输出的内容时,依然需求停止偶然的人工干涉。凭据模型向终端用户通报价值的方法,该用户本身可以对模型停止改正或标注,企业也可以经过运用质量控制的“AI保姆”来处置惩罚异常。假如企业正在建模的情况不不变且变革速率很高,那么企业能够需求在不变形态下保存一组标注器,以便凭据需求运用新的数据更新模型。

扩展AI业务

第一批乐成的AI企业进入市场时,经过提供无AI的事情流东西来捕捉训练AI模型的数据,而且该数据最终进步了东西的价值。这些初创企业在晚期就可以完成软件利润,由于数据和人工智能在其价值主张中居于主要职位。但是,随着市场转向更专业的AI使用,下一波AI创企将面临更高的启动本钱,并将泯灭更多的人力来为客户提供初始价值,招致其成为低利润率的办事企业。

取得少量客户和数据最终将降低单元经济效益和构建至关重要的复合防备才能,但许多初创企业并不确切地理解这一点,也不明白他们需求接纳哪些举动才气更快地完成目的。而精彩的AI创企则会经过这种方法停止优化权衡,有方案地停止投资并迅速扩张。

(责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片