未来机器人取代人类后人类将走向何方？

2020-06-30 09:54:00 来源：电子说

人工智能，包括机器学习，现在是一个重要的技术趋势。在这个领域已经有许多独角兽创业公司，科技巨头们也很早就开始布局了。只要你对这项技术有一点了解，你就会明白数据是机器学习的养料。已经拥有大量数据的技术巨头会变得更强大，甚至形成垄断吗？后来的初创公司还有机会吗？

为什么数据对机器学习很重要？

首先，为什么数据对机器学习如此重要？举个例子。过去，使用传统方法构建系统来识别某些东西需要一系列复杂的规则。例如，要识别图片中的猫，有必要建立一系列规则来识别猫的轮廓、毛发、腿、眼睛和耳朵，并将它们整合在一起。但在实践中，这种方法过于复杂，不可行。

如果你使用机器学习来识别猫，你不需要写规则，但是提供数据和例子给统计引擎，它将产生一个有辨别能力的模型。然后你给它100，000张标有“猫”的图片和100，000张标有“不是猫”的图片，机器就能分辨出它们之间的区别。机器学习用自动确定的数据模式取代了手写的逻辑步骤。对于范围广泛的问题，机器学习的效果会更好。例如，在计算机视觉、文本和发音方面，它有非常典型的用例。

对于机器学习，你需要多少数据来达到目标是一个浮点数。一些研究方向是让机器学习使用更小的数据集来完成这项工作，但目前，更多的数据几乎总能得到更好的结果。

巨人有很多数据，这会帮助他们垄断吗？

因此，问题来了：如果机器学习能重建许多重要的东西，而且数据越多，机器学习会给你更好的结果。那么，这是否意味着拥有大量数据的公司会变得更强大，因为它们已经是巨人了？这种赢家通吃的效应会有多强？因为这背后的原因似乎很清楚：“更多数据=更准确的模型=更好的产品=更多用户=更多数据”。因此会有一些说法：“谷歌/脸书/亚马逊拥有所有数据，中国拥有所有数据，那些拥有大量数据的科技公司和拥有大量人口和丰富数据的国家将在竞争中获得优势。”

在某种程度上，这可能是真的。

然而，尽管机器学习需要大量的数据，你使用的数据必须非常具体，只有这样你才能解决具体的问题。通用电气有很多燃气轮机遥测数据，谷歌有很多搜索数据，美国运通有很多信用卡欺诈数据。你不能用涡轮机数据作为例子来发现欺诈交易，你也不能用网络搜索的数据来发现即将发生故障的燃气涡轮机。也就是说，机器学习是一种通用技术，可以用于欺诈监控和人脸识别，但是用它构建的特定应用程序彼此并不通用。每个特定的模型或应用程序只能做一件事。

这与以前自动化技术的普及类似：就像洗衣机只能洗衣服但不能洗完一样，机器学习支持的翻译程序不能识别猫的图片。您构建的应用程序和这些应用程序所需的数据集非常具体，它们只能胜任特定的任务(当然，有一些前沿研究试图使一些数据集更加通用)。)

因此，可以通过机器学习实现的应用非常广泛和分散。谷歌不会“拥有所有数据”，它只会拥有谷歌自己的数据。谷歌将使用机器学习技术获得更好的搜索结果，通用电气将获得更好的引擎遥测，沃达丰将获得更好的呼叫模式分析和网络规划，这是不同公司建立的不同服务和功能。谷歌可以利用机器学习让自己的业务变得更好，但这并不意味着谷歌可以利用机器学习垄断其所有业务。

换句话说，机器学习可以让每个行业的大公司变得更强大。沃达丰、通用电气和谷歌拥有各自行业的“所有数据”，这将赋予它们更强的竞争优势，并深化现有的壁垒。但是问题并不那么简单。我们可以问这样的问题：谁拥有这些数据，这些数据有多有用，在什么级别上有效，以及如何汇总和分析它们是正确的？

如何聚集和分析数据是有意义的？

作为一家公司的创始人，你可以思考以下问题：作为一家行业公司，你是否收集并管理过自己的数据，并建立了一个机器学习系统来分析这些数据，或者你是否找到了一个相应的人工智能供应商来做这件事？事物；您的供应商是否提供已在其他数据集上培训过的成品，或者根据您的数据定制培训，或者将您的数据与其他数据集混合在一起进行培训？您的供应商是否需要您的数据来优化模型，或者整个行业的数据已经非常丰富，现成的数据集就足够了？这些问题的答案在不同的业务部门、不同的行业和不同的业务部门是不同的。

另一方面，如果你是一家人工智能初创公司，想要切入某个子行业来解决实际问题，有两个关于数据的基本问题：如何获取第一组数据来训练你的模型，并使用它来获取第一个客户，以及你需要多少数据？

第二个问题可以分解成许多问题：是否用相对较少的容易获得的数据集(但许多竞争对手也可以获得)来解决问题，或者是否使用更难获得且规模更大的数据集，如果是后一种情况，它能否受益于网络效应，从而形成赢家通吃的局面？随着数据越来越多，产品会越来越好，还是会有一个S曲线？

这取决于以下因素：

有些数据集是企业或产品独有的，或者可以提供强大的专有优势。通用电气的发动机遥测数据可能对分析罗尔斯罗伊斯的航空发动机没有用处，即使有用，也不会被共享。这可能是一个创业的机会，但对于许多大公司的信息技术和外包项目承包商来说，这也是一个引人注目的地方。

有些数据集更常见，可以应用于更多的行业和公司。“这个顾客很奇怪”可能适用于所有信用卡公司，而“顾客听起来很生气”适用于大多数呼叫中心。这个共同的问题可以催生出许多公司，这些公司可以在此基础上解决不同行业的共同问题。这里有数据的网络效应。

然而，可能还有另一种情况。达到一定的分界点后，模型非常成熟，制造商可以在没有更多数据的情况下很好地构建产品。

人工智能应该如何创业？

在实际创业中，随着机器学习的广泛应用，初创企业总能在细分中找到突破口。例如，Everlaw进入了一个与法律相关的领域：一场诉讼会产生大量的纸质文件，机器学习可以分析这些文件。一方面，它可以找到具有共性的文件，如“包含焦虑的文件”；另一方面，它可以进行聚类分析以找到与所选文件相似的其他文件。但这些问题不需要根据具体案例的数据进行培训，而是可以通过一些行业范围的数据集来解决。

Drishti是一家使用计算机视觉分析工厂生产线的公司。它的一些功能需要从客户公司的数据中进行培训，但它的功能是多方面的，可以跨行业工作。

举一个极端的例子，我最近接触到一家大型汽车发动机工厂，他们利用机器学习来优化轮胎爆裂监控传感器，使其更加精确。这些训练数据是由他们自己制作的，他们做了很多有无爆胎的实验。显然，如果你想得到数据，你总是可以得到数据。这只是数据，你不能建护城河。

因此，回到核心问题，机器学习初创企业必须面对两个问题：如何获取数据以及需要多少数据？但这些只是技术问题：你应该考虑你的目标市场是什么，如何进入市场，你想解决的问题对你的客户有多大价值，等等。也就是说，很快就不会有“人工智能”初创公司，它们将是工业过程分析公司、法律平台公司或销售优化公司等。事实上，机器学习的流行并不意味着谷歌正在变得更强大，而是各种各样的初创公司可以使用这种先进的技术比以前更快地建立业务。

我用一个比喻来做最后的结论。我们可以将机器学习与数据库进行比较。数据库非常重要，它是一种基础设施，包含各种场景。如果你不使用它，而你的竞争对手使用它，你就会落后。当它还是一个新事物时，一些公司利用这种技术来获得竞争优势。沃尔玛的部分成功来自于使用数据库，它可以更有效地管理库存和物流。但是今天，如果你开了一家零售商，说我们正在使用最先进的数据库技术；那就不会让你与众不同。数据库已经成为一种通用的技术基础设施，不再是特殊的。同样的事情将来也会发生在机器学习中。

栏目导读

: 无人车“入春”，批量上路仍需“爬坡”

　　防控疫情的需求激发之下，代替人类送药、送餐送菜、消毒巡逻的无人车成了疫情期间的特殊尖兵。疫情过后，无人车配送是否...
2020-03-23 17:12

: 5G、AI、大数据的发展，对智慧城市会有什么影响

市场分调研机构Omdia的最新数据分析显示，全球智能城市人工智能（AI）软件市场将从6 738亿美元（2019年)，在2025年将增长到4...
2020-04-07 17:55

: 机器人制造过程中的传感器技术之磁光效应传感器

现代电测技术日趋成熟，由于具有精度高、便于微机相连实现自动实时处理等优点，已经广泛应用在电气量和非电气量的测量中。
2020-04-07 17:56

: 微软不需要快速拥抱VR

微软经常在游戏领域开辟路径，扮演开拓者的角色，这一点体现在很多方面，包括微软的尖端技术（DX12终极版 DX光追），硬件（X...
2020-04-07 17:57

: 波音Starliner载人航天器再次展开测试

去年 12 月，波音为美国宇航局发射了未载人的 Starliner 航天器。然而由于技术问题，任务并没有按计划进行。作为 NASA ...
2020-04-07 17:58

焦点

头条关注

热点新闻

未来机器人取代人类后 人类将走向何方？

无人车“入春”，批量上路仍需“爬坡”

5G、AI、大数据的发展，对智慧城市会有什么影响

机器人制造过程中的传感器技术之磁光效应传感器

微软不需要快速拥抱VR

波音Starliner载人航天器再次展开测试

未来机器人取代人类后人类将走向何方？