中新网万宁12月16日电 (卓琳植)2019中国冲浪冠军巡回赛暨U系列赛事(万宁站)15日迎来首个决赛日,运动员们争分夺秒,灵巧抓浪、切板回旋,日月湾海面上演了一场场精彩对决。经过角逐,海南代表队在单项赛中收获7金4银3铜,成为比赛最大赢家。

下面就让我介绍几个在有限的数据上使用深度学习的方法,以及阐述为什么我认为这可能是未来研究中最令人兴奋的领域之一。

希望本文为你提供了一些关于如何在有限的数据上使用深度学习技术的思路。我个人认为,这是一个目前没有得到足够讨论的问题,但它具有令人非常兴奋的意义。

微调的基本思想是取一个一定程度上跟模型所在域相似的非常大的数据集,训练一个神经网络,然后用你的小数据集对这个预先训练好的神经网络进行微调。你可以在 A Comprehensive guide to Fine-tuning Deep Learning Models in Keras 这篇文章阅读更多内容:

运动员们争分夺秒,灵巧抓浪。李亚洪 摄

我将其作为最后的选择,是因为结合先验知识可能是一个挑战,通常也是最耗费时间的。

国家冲浪队领队兼海南队主教练马福来说,随着冲浪运动在中国的不断发展,队员们接受的入门训练已经十分专业,这也为他们成绩的提高打下坚实基础。年轻队员的进步之快,在赛事中得到了很好的体现。

最后一点是尝试找到结合特定领域知识的方法,以指导学习过程。例如,在论文《通过概率程序规划归纳进行类人概念学习》(Human-level concept learning through probabilistic program induction,论文链接:https://science.sciencemag.org/content/350/6266/1332)中,作者构建了一个能够在学习过程中利用先验知识从部分概念中构造整体概念的模型,这样的模型能够实现人类水平的性能,并超出了当时的深度学习方法。

如果你无法获得更多的数据,并且无法成功地对大型数据集进行微调,那么数据增强通常是你接下来的最佳选择。它还可以与微调一起使用。

运动员们争分夺秒,灵巧抓浪。李亚洪 摄

例如,你有一张猫的图片,旋转图片后仍然是一张猫的图片,这便是一次不错的数据增强。另一方面,如果你有一张道路的图片,想要预测适当的方向盘转度(自动驾驶汽车),若旋转这张道路的图片将会改变适当的方向盘转度,除非你把方向盘转度调整到适当位置,否则难以预测成功。

图为颁奖现场。韩星 摄

你也可以使用域知识来限制对网络的输入,以降低维度或将网络体系结构调整的更小。

他指出,海事业走向数字化和智能化是大势所趋,中国船舶工业开展了“智能船舶1.0”研发专项等技术研究和实船示范应用,先后交付了全球首艘40万吨智能超大型矿砂船(VLOC)、30.8万吨超大型智能油船(VLCC)等智能船舶。面对“压载水管理公约”“硫排放限令”等国际海事组织密集生效的新标准、新规范,中国船舶工业积极应对,船舶压载水处理系统和船舶尾气处理装置市场涌现了一批具有世界先进技术水平和建造能力的配套企业,在与国际巨头的“同场竞技”中取得了不错的业绩。

图为选手风采。李亚洪 摄

记者获悉,本届会展展览面积超过9万平方米,吸引超过30个国家和地区的2200家企业参展,约2/3为境外企业。智能航运是各大展商的展示重点,低排放及零排放技术和产品、豪华邮轮技术等将成为展会热点。

经过6天的激烈角逐,2019年第十届万宁国际冲浪赛国内赛赛段第一场比赛2019中国冲浪冠军巡回赛暨U系列赛事(万宁站)落下帷幕,海南代表队收获满满,一举拿下U18男女子长、短板,专业组男子长、短板,专业组女子长板等7个单项赛事冠军。

雷锋网原创文章,。详情见转载须知。

对于图像分类问题,最常用的数据集是 ImageNet。这个数据集涵盖目标多个类的数百万张图像,因此可以用于许多类型的图像问题。它甚至包括动物,因此可能有助于稀有鸟类的分类。

九、让深度学习在小数据上也能变得很酷

这听起来可能很荒谬,但是你真的考虑过自己能否收集更多的数据吗?我经常向公司提出获取更多数据的建议,但他们视我的建议如疯人疯语,这让我很吃惊。是的,投入时间和金钱去收集更多的数据是可行的,而事实上,这通常也是你最好的选择。例如,也许你正试图对稀有鸟类进行分类,但数据非常有限。几乎可以肯定地说,你可以仅仅通过标注更多的数据来比较轻易地解决这个问题。你不确定需要收集多少数据?对此,你可以在增加额外的数据时尝试绘制学习曲线(相关教程链接:https://www.dataquest.io/blog/learning-curves-machine-learning/),并同时查看模型性能的变化,从而确定所需的数据量。

现在假设你已经有一个简单的基线模型,且在获取更多数据上要么不可行要么太昂贵。此时最可靠和正确的方法是利用预训练模型,然后针对你的问题对模型进行微调。

邢文华表示,中国船舶工业借助“一带一路”倡议和大力发展海洋经济的东风,在大型豪华邮轮、高端海洋工程装备、LNG船、超大型集装箱船、高端客滚船、高端海洋牧场装备、海洋科考船等领域都实现了新的突破。尤其是今年10月,中国首艘大型豪华邮轮在上海外高桥造船有限公司开工建造,显示中国朝着摘取船舶工业皇冠上最耀眼明珠的目标又迈进了一大步。但处于国际造船市场重要地位的中国船舶工业与全球同样面临严峻形势。今年前十个月,中国造船完工量、新接订单量、手持订单量分别占世界市场份额的37.1%、41.8%和44.1%,继续领跑全球。但新船订单承接量同比下降25.6%,10月底手持订单量同比下降7.7%。

据悉,作为第十届万宁国际冲浪赛国内赛之一的2019年第三届中国大学生桨板竞速挑战赛将于12月17日至19日在万宁石梅湾赛场举办,届时将有来自全国15个高等院校近百名运动员角逐桨板竞速绕标环岛500米(男子赛、女子赛)、桨板竞速绕标环岛3公里(男子赛、女子赛)和桨板竞速绕标环岛4ⅹ500米接力赛(男女混合赛)。(完)

当天,专业组男子长板决赛竞争尤为激烈,黄耀书和黄玮作为赛前热门选手在比赛中备受关注。今年11月举办的亚洲冲浪锦标赛男子长板项目中,黄玮、黄耀书分获冠军、季军。

比赛中,黄玮、黄耀书大展身手,乘风御浪。海南代表队15岁小将黄耀书脚踏长板,以高难度的“挂10”转向动作组合,冲出全场最高分浪——9.0分,这也是整场赛事中的最高分浪。最终,黄耀书以总分15.17分的成绩赢得冠军,黄玮以总分13.50分位列第二成为亚军。

在我们探讨在有限的数据上使用深度学习的方法之前,请先从神经网络后退一步,建立一个简单的基线。用一些传统模型(如随机森林)进行实验通常不会花费很长时间,而这将有助于评估深度学习的所有潜在提升,并针对你的问题提供更多权衡深度学习方法和其他方法的视角。

从中得到的关于小数据的益处是确保你建立的深度网络能利用这种集成效应。

众所周知,深度学习是有史以来最棒的事情。它能够在大量数据上以低成本解决复杂问题。唯一的问题是你既不在谷歌工作,也不在脸书工作,你的数据是稀缺的,那么你该怎么办?你是能继续使用是深度学习的能力,还是已无计可施?

选手逐浪。李亚洪 摄

如果你需要复习自编码器相关知识,可以看看斯坦福大学的深度学习教程(网址:http://ufldl.stanford.edu/tutorial/unsupervised/Autoencoders/)。自编码器的基本思想是建立一个预测输入的神经网络。

大量问题的数据非常有限,因为获取更多的数据要么非常昂贵要么不可行,就比如说检测罕见疾病或教育成果。找到方法来应用深度学习等最好的技术来解决这些问题是非常令人兴奋的!正如吴恩达(Andrew Ng)也曾提到:

在为期4天的会展期间,丹麦、德国、日本、韩国、挪威、美国、英国、中国等16个国家和地区的企业以国家或地区馆的形式参展,包括中船集团、中远海运集团、招商局工业集团、振华重工、三菱、川崎、达门、芬坎蒂尼、ABB、西门子、麦基嘉、康斯伯格、卡特皮勒、曼恩、罗尔斯罗伊斯、瓦锡兰和阿法拉伐等在内的主要行业巨头和知名企业悉数亮相。除展览、展示外,还将举行高级海事论坛,内容涉及造船和海洋工程、邮轮内装、航运和港口、海事金融和法律、船舶与海工配套设备技术等方面。预计本届会展将吸引超过100个国家和地区的65000多名专业观众,与上届相比,各项数据均有所提升,再创历届新高。(完)

从上图中可以看出,基于每个类的样本数量的性能是如何变化的,以及微调对于一些小型数据集(CUB)是多么有价值,而对于其他数据集(CIFAR-100)则没有那么有价值。

数据增强背后的思想很简单:在不改变标签值的情况下,以提供新数据的方式改变输入。