使用深度学习文本一键生成人脸

阅读器深度学习小说吴恩达脸部图像识别

来源 : 雷锋网 2018-07-12 15:59 阅读量：0

阅读小说时，我经常好奇小说中描述的角色在现实中会是怎样的。从整体想象任务角色是可行的，但要将描述变为更为深刻的细节是相当有挑战的，而且经常不同的人有不同的解释。很多时候，我只能想象到一个非常模糊的面孔，直到故事的结尾。只有书本被翻译成电影时，模糊的面孔才会被细节所填满。例如，我无法想象《列车上的女孩》中 Rachel 的具体长相。但当这部电影播出时，我可以将 Emily Blunt 的脸和 Rachel 联系起来。演员们肯定付出了很多努力才能从剧本中准确获得角色。

用于创建深度学习模型的数据毫无疑问是最原始的人工智能：正如吴恩达教授在他的 deeplearning.aicourses 上所说「在机器学习领域成功的人并不是哪些拥有优秀算法的人，而是拥有优秀数据的人」。因此，我开始寻找一组有漂亮、丰富和多样的文本描述的脸部数据集。

使用深度学习文本一键生成人脸0

使用深度学习文本一键生成人脸

我偶然发现了大量的数据集要么仅仅只有人脸，要么是人脸和 ID（用于识别），要么是含有其他信息的人脸数据，比如眼睛颜色：蓝，脸型：椭圆，头发：金色，等。但这都不是我所需要的。我最终的选择是使用一个早期的项目（从结构化数据中生成自然语言描述），在这个早期的项目中实现了从结构化数据生成自然语言摘要。但这会对已经充满噪声的数据集再增加噪声信息。

随着时间的流逝和研究的进展，提出了 Face2Text：收集一个带注释的图像描述语料库，用于生成丰富的面部描述：这就是我想要的。特别感谢 Albert Gattand Marc Tanti 提供了 Face2Text 数据集的 v1.0 版本。

Face2Text v1.0 版本数据集包含 400 个随机从 LFW（自然环境下已标记的人脸数据）选择的图像的自然语言描述。这些描述被清理干净，去除了那些对图片中人物的不相关的说明。其中一些描述不只描述了脸部特征，也提供了一些图片的隐藏信息。例如，其中一个脸部描述：「照片中的人可能是一个罪犯」。基于这些因素，以及数据集相对较小，我决定使用它证明我的架构。最终，我们可以扩展这个模型，并灌输更大、更多样的数据集。

声明： 本网站原创内容，如需转载，请注明出处；本网站转载内容（文章、图片、视频等资料）的版权归原网站所有。如我们转载或使用了您的文章或图片等资料的，未能及时和您沟通确认的，请第一时间通知我们，以便我们第一时间采取相应措施，避免给双方造成不必要的经济损失或其他侵权责任。如您未通知我们，我们有权利免于承担任何责任。我们的联系邮箱：news@cecb2b.com。

好文章，需要你的鼓励！

分享到：

您可能感兴趣的文章

;