• CNN与RNN中文文本分类-基于TensorFlow实现

    本章旨在使用TensorFlow API实现卷积神经网络与循环神经网络文本分类。 代码地址:Github 转载请注明出处:Gaussic CNN做句子分类的论文可以参看: Convolutional Neural Networks for Sentence Classification 还可以去读dennybritz大牛的博客:Implementing a CNN for Text Classification in TensorFlow 以及字符级CNN的论文:Character-level Convolutional Networks »

    使用TensorFlow训练循环神经网络语言模型

    读了将近一个下午的TensorFlow Recurrent Neural Network教程,翻看其在PTB上的实现,感觉晦涩难懂,因此参考了部分代码,自己写了一个简化版的Language Model,思路借鉴了Keras的LSTM text generation。 代码地址:Github 转载请注明出处:Gaussic 语言模型 Language Model,即语言模型,其主要思想是,在知道前一部分的词的情况下,推断出下一个最有可能出现的词。例如,知道了 The »

    TensorFlow - TensorBoard可视化

    本章主要说明如何使用TensorBoard进行可视化,以及部分的调参方法。 这是一篇dandelionmane在TensorFlow Dev Summit 2017关于TensorBoard介绍的总结教程。 转载请说明出处:Gaussic 在之前的章节中,几乎所有的性能评估都是通过打印中间结果字符串来完成的。使用更多的可视化的图表可以让人对模型有一个更加直观的认识。在本章中,我们将使用TensorBoard对模型进行可视化。 计算图可视化 要可视化TensorFlow的计算图,需要先构建网络。 网络层 本章的网络,依然使用之前几个章节对MNIST数据集使用的网络结构。为了方便实现,固定了其中的一部分参数。相关层如下: # 简单卷积层,为方便本章教程叙述,固定部分参数 def »

    TensorFlow - 保存/恢复/提前终止

    本章主要说明如何对训练过程进行存储,恢复操作。以及在模型长期没有改进时,提前终止训练。 这是几篇与原作不完全相同的教程,转载请说明出处:Gaussic 原作者:Magnus Erik Hvass Pedersen / GitHub / Videos on YouTube 在第三章中,我们使用TensorFlow的API重新构建了网络,并且训练了10000轮次得到了98.7%的测试准确率。然而,在实际训练过程中,模型的结构往往比这更加复杂,数据量也更多,训练10000轮次需要较长的时间。 »

    TensorFlow - Layers API

    本章主要说明如何使用TensorFlow API简化神经网络构建,以及新的变量获取方法,在原作的基础上会做相应的改变。 这是几篇与原作不完全相同的教程,转载请说明出处:Gaussic 原作者:Magnus Erik Hvass Pedersen / GitHub / Videos on YouTube 在第二章中,我们实现了使用卷积神经网络对MNIST数据集进行分类。可以发现,需要实现一个简单的CNN模型,也需要实现很多细节类的代码,如定义权重、偏置、展平操作等。TensorFlow对这些模型做了一定的API封装,使得使用者可以更加方便地实现神经网络的构建。 »

    TensorFlow - 卷积神经网络

    本章主要说明如何使用神经网络训练MNIST手写体字符识别,以及如何可视化权重。 这是几篇与原作不完全相同的教程,转载请说明出处:Gaussic 原作者:Magnus Erik Hvass Pedersen / GitHub / Videos on YouTube 在上一章节中,我们在MNIST数据集上得到了91%的测试准确率。这个结果其实并不太理想。 在本章中,我们将使用卷积神经网络来得到一个准确率更高的模型,接近99%。卷积神经网络使用共享的卷积核对图像进行卷积操作,以提取图像深层特征。这些深层特征然后组合成特征向量输入全连接的神经网络中,再使用类似上一章的方法进行分类。 网络结构图 »

    TensorFlow - 线性模型

    本章主要通过线性模型介绍TensorFlow的一些基本使用流程。 这是几篇与原作不完全相同的教程,转载请说明出处:Gaussic 原作者:Magnus Erik Hvass Pedersen / GitHub / Videos on YouTube 需要导入的包 import tensorflow as tf # TensorFlow import matplotlib.pyplot as plt # matplotlib绘图 import »

    TF-IDF关键词提取实现

    本文旨在对特定的语料库生成各词的逆文档频率。然后根据TF-IDF算法进行关键词提取。 转载请注明出处:Gaussic 。 GitHub代码:https://github.com/gaussic/tf-idf-keyword 分词 对于中文文本的关键词提取,需要先进行分词操作。 去除其中的一些英文和数字,只保留中文: import jieba import re def segment(sentence, cut_all=False): sentence »

    Pytorch整理:60分钟入门

    由于种种原因,近段时间开始尝试使用Pytorch。照着官方给的教程慢慢搞,稍微有一点点理解。在这里做一点小小的记录和翻译工作。 官方地址:Deep Learning with PyTorch: A 60 Minute Blitz 感谢作者: Soumith Chintala 转载请说明出处:Gaussic:夜露 这个教程的目标: 更高层次地理解Pythrch的Tensor库以及神经网络。 训练一个小的神经网络模型用于分类图像。 什么是Pytorch 这是一个基于Python的科学计算包,主要针对两类人群: »

    深度神经网络训练IMDB情感分类的四种方法

    Github代码: Keras样例解析 转载请注明出处:https://blog.gaussic.com Keras 的官方 Examples 里面展示了四种训练 IMDB 文本情感分类的方法,借助这 4 个 Python 程序,可以对 Keras 的使用做一定的了解。以下是对各个样例的解析。 IMDB 数据集 IMDB 情感分类数据集是 »