有关深度学习的一些想法和困惑

9月 6 2018 AI 19 分钟读完 (约 2851 字)

目前看来，深度学习模型在智能方面取得的进展只是在时间和规模尺度上对某些人类基本能力的延伸。由于让渡了一部分对模型的控制权和解释性，在充分利用数据和算力的同时，深度学习面临着复现困难、不便推广等问题。

《西部世界》狂想曲（含剧透）

8月 12 2018 Reviews 31 分钟读完 (约 4604 字)

绝对的意义虽不能至，相对的意义却触手可及。冷静、克制地归纳我们所取得的进展，审慎、理性地建立共识，进而丰富原有科学和哲学框架的内涵、探索前进的趋势，寻求具有公众意义的文化、伦理层面的讨论等，都是具有建设意义的明智之举。

[论文笔记](DenseNet)Densely Connected Convolutional Networks

1月 6 2018 Papers 2 分钟读完 (约 350 字)

DenseNet将shortcut-connection的思路发挥到极致。在一个DenseBlock内部，每一层的输出均跟后面的层建立shortcut，特别需要注意的是，不同于ResNet中的相加，DenseNet连接shortcut的方式是Concat，这样越深的层则输入channel数越大。

[源码笔记]keras源码分析之Model

7月 30 2017 AI 7 分钟读完 (约 1086 字)

本篇是keras源码笔记系列的第三篇。在前两篇中，我们分析了keras对Tensor和Layer等概念的处理，并说明了它们是如何作用别弄个构成有向无环图的。本篇着眼于多层网络模型层面的抽象，即与用户距离最近的接口，源代码文件是/keras/engine/training.py和/keras/model.py，要观察的类是Model和Sequential。

[源码笔记]keras源码分析之Container

7月 25 2017 AI 7 分钟读完 (约 1047 字)

本篇继续讨论keras的源码结构。

第一篇源码笔记中我们观察了Layer, Tensor和Node是如何耦合在一起的，而本篇的重点是观察多层网络构成的有向无环图（DAG）。主要涉及的文件为keras/engine/topology.py，要观察的类是Container。

深度学习中的权重衰减

7月 22 2017 AI 18 分钟读完 (约 2745 字)

权重衰减（weight dacay），即L^2范数惩罚，是最常见的正则化技术之一。本文将介绍它是如何起作用的。主要材料来自The Deep Learning Book。

[源码笔记]keras源码分析之Layer、Tensor和Node

7月 15 2017 AI 9 分钟读完 (约 1295 字)

Keras架构的主要逻辑实现在/keras/engine/topology.py中，主要有两个基类Node()和Layer()，一个重要函数Input()。具体地，

Layer()是一个计算层的抽象，完成网络中对Tensor的计算过程；
Node()描述两个层之间连接关系的抽象，配合Layer()构建DAG；
Input()实例化一个特殊的Layer(InputLayer)，将backend（TensorFlow或Theano）建立的Tensor对象转化为Keras Tensor对象。