TensorFlow练习3-RNNs实现分类

接着练习TensorFlow, 这一节开始实现RNNs(循环神经网络), 同样使用mnist数据集，测试正确率也基本可以到99%。同CNNs, RNNs的结构以及训练方式这里不加赘述，重心放在实现上。

提到循环神经网络(Recurrent Neural Networks)，下面这张图就不得不说:

RNNs 主要处理时序数据，比如一句话，词与词之间都是有顺序的，因此经常用在NLP领域，比如机器翻译，情感分析等。一般的RNNs有多个FNN横向连接而成，其中中间有个rnn-cell, 存储的是前面序列的隐含状态s。分解开来的话，就相当于三层，第一层是输入x到rnn-cell的连接，第二层是rnn-cell,得到的是隐藏状态s，第三层是rnn-cell到输出o的连接层。下面开始一步一步实现。

第一步我们需要想办法把mnist的数据定义为时序数据，开始数据是 28X28的，因此我们可以按行来看，第一行是第一个时间点，下一行是第二个时间点的数据，对应到上图就是: 第一行的数据是\(x_0\)，第二行的数据为\(x_1\)，依次类推。另外，这一节我们主要用RNNs做分类，因此只关心最后一个时间点的输出即可。因此我们实现的结构其实是下图这样的: 下一节会讨论回归问题，就是考虑所有输出:

首先定义一些后面使用的参数:


# hyperparameters
lr = 0.001 # learning rate
batch_size = 128
n_inputs = 28 # 每一行的维度
n_steps = 28 # 28 行
n_hidden_unins = 128 # 中间FNN的hidden units
n_classes = 10  # FNN最后的输出类别个数

接着定义TensorFlow的输入：

1
2
3

# tf input
xs =tf.placeholder(tf.float32, [None, n_steps, n_inputs], name="inputs")
ys =tf.placeholder(tf.float32, [None, n_classes], name="outputs")

RNNs每一个单元里面包含一个三层的普通神经网络，因此我们事先设置一下这里面的权重矩阵和偏置，需要注意的是，RNNs的一个特点就是权值共享，所有层用的权重矩阵一样 :

# W & b
weights = {
    'in': tf.Variable(tf.random_uniform([n_inputs, n_hidden_unins], -1.0, 1.0), name="in_w"), # 输入层到中间层权重矩阵
    'out': tf.Variable(tf.random_uniform([n_hidden_unins, n_classes], -1.0, 1.0), name="out_w"), # 中间层到输出层的权重
}
b = {
    'in': tf.Variable(tf.constant(0.1, shape=[n_hidden_unins]), name="in_bias"), # 偏置
    'out': tf.Variable(tf.constant(0.1, shape=[n_classes]), name="out_bias"),
}

下面开始定义RNNs网络结构首先输入层到rnn-cell：就是一个简单的前馈层，不过要特别注意数据的维度

# hidden_layer for input
# X : (128, 28, 28)
with tf.name_scope("inlayer"):
    # 本来数据是 batch_size ，28 ， 28,但是这样的无法与权重进行相乘，
    # 因此需要转为 -1 * 28, 这里的-1表示任意长度，就相当与把原来数据拉伸一下，从厚变长
    # 但是rnn-cell还需要序列数据，因此后面还需要恢复为batch_size, 28,28的维度，再从长变回厚
    X = tf.reshape(X, [-1, n_inputs])  # [batch_size*28, 28]
    # [batch_size * 28, 28] * [28, hidden_units] =>[batch_size * 28, hidden_units]
    X_in = tf.matmul(X, weights['in']) + b['in']
    X_in = tf.reshape(X_in, [-1, n_steps, n_hidden_unins]) # 长->厚： []batch_size, 28, 128]

接着是中间的cell，这个TensorFlow作了很好的封装，我们只需要传入需要的参数就可以了：

# RNN cell
with tf.name_scope("RNN_CELL"):
    lstm_cell = tf.nn.rnn_cell.BasicLSTMCell(n_hidden_unins) #根据隐层的神经元个数，定义一个基本的Cell
    outputs, states = tf.nn.dynamic_rnn(lstm_cell, X_in, dtype=tf.float32) # 传入lstm_cell与上层的输出:X_in即可

这里有点需要说明的是，本来RNN是需要一个初始状态的，这样才能够向后传递，但是TensorFlow可以随机产生一个初始状态矩阵，但是需要在tf.nn.dynamic_rnn的参数里面指定dtype=tf.float32，不然会报错。当然可以向下面的指定初始状态:

1
2
3

lstm_cell = tf.nn.rnn_cell.BasicLSTMCell(n_hidden_unins) #根据隐层的神经元个数，定义一个基本的Cell
_init_state = lstm_cell.zero_state(batch_size, dtype=tf.float32)
ouputs, states = tf.nn.dynamic_rnn(lstm_cell, X_in, initial_state=_init_state)

这里的输出states表示最后隐层的状态tuple，实际value在states[1]内。前面已经说了，我们只需要最后的输出结果，因此只需要加一个输出层就好：

1
2
3

# out layer
with tf.name_scope('outlayer'):
    results = tf.matmul(states[1], weights['out']) + b['out']

到此，网络结构构建完成，后续便是cross-cost, accuracy，这与前面基本一样:

pred = RNN(xs, weights, b) # 这里将上述的层，定义为了一个函数
# cost
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(pred, ys)) # 交叉熵损失函数
train_op = tf.train.AdamOptimizer(lr).minimize(cost) # Adam训练方式
# accuracy
correct_pred = tf.equal(tf.argmax(pred, 1), tf.argmax(ys, 1))
accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

运行结果如下,正确率可以接近99%，但是比CNN训练快一倍时间, 通过调整参数，应该可以到99%+，从此可以看出来，虽然我们是强行将图片变为时序数据，但是效果也很好,看来RNN的适用范围还是蛮广的.

epoch: 1 accuracy: 0.9519
epoch: 2 accuracy: 0.9709
epoch: 3 accuracy: 0.9789
epoch: 4 accuracy: 0.9788
epoch: 5 accuracy: 0.9819
epoch: 6 accuracy: 0.9829
epoch: 7 accuracy: 0.9828
epoch: 8 accuracy: 0.9848
epoch: 9 accuracy: 0.9829
epoch: 10 accuracy: 0.9831
epoch: 11 accuracy: 0.9851
epoch: 12 accuracy: 0.9854
epoch: 13 accuracy: 0.9815
epoch: 14 accuracy: 0.9846
epoch: 15 accuracy: 0.9832
******************************
training finish.
cost time: 94 seconds
accuracy: 0.9832

完整代码如下:

#!/usr/bin/env python
# encoding: utf-8

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

# hyperparameters
lr = 0.001 # learning rate
batch_size = 128

n_inputs = 28 # 28 cl
n_steps = 28 # 28 rows -> time stamps

n_hidden_unins = 128 # hidden units
n_classes = 10

# tf input
xs =tf.placeholder(tf.float32, [None, n_steps, n_inputs], name="inputs")
ys =tf.placeholder(tf.float32, [None, n_classes], name="outputs")

# W & b
weights = {
    'in': tf.Variable(tf.random_uniform([n_inputs, n_hidden_unins], -1.0, 1.0), name="in_w"),
    'out': tf.Variable(tf.random_uniform([n_hidden_unins, n_classes], -1.0, 1.0), name="out_w"),
}
b = {
    'in': tf.Variable(tf.constant(0.1, shape=[n_hidden_unins]), name="in_bias"),
    'out': tf.Variable(tf.constant(0.1, shape=[n_classes]), name="out_bias"),
}

def RNN(X, weights, bias):

    # hidden_layer for input
    # X : (128, 28, 28)
    with tf.name_scope("inlayer"):
        X = tf.reshape(X, [-1, n_inputs])
        X_in = tf.matmul(X, weights['in']) + b['in']
        X_in = tf.reshape(X_in, [-1, n_steps, n_hidden_unins])

    # RNN cell
    with tf.name_scope("RNN_CELL"):
        lstm_cell = tf.nn.rnn_cell.BasicLSTMCell(n_hidden_unins)
        # _init_state = lstm_cell.zero_state(batch_size, dtype=tf.float32)
        # ouputs, states = tf.nn.dynamic_rnn(lstm_cell, X_in, initial_state=_init_state)
        outputs, states = tf.nn.dynamic_rnn(lstm_cell, X_in, dtype=tf.float32)


    # out layer
    with tf.name_scope('outlayer'):
        results = tf.matmul(states[1], weights['out']) + b['out']

    return results

pred = RNN(xs, weights, b)

# cost
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(pred, ys))
train_op = tf.train.AdamOptimizer(lr).minimize(cost)

# accuracy
correct_pred = tf.equal(tf.argmax(pred, 1), tf.argmax(ys, 1))
accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

# run
import time
init = tf.global_variables_initializer()
epochs = 15

st = time.time()
with tf.Session() as sess:
    writer = tf.summary.FileWriter('logs/', sess.graph)
    sess.run(init)

    batch = mnist.train.num_examples / batch_size
    for epoch in range(epochs):
        for i in range(int(batch)):
            batch_x, batch_y = mnist.train.next_batch(batch_size)
            batch_x = batch_x.reshape([batch_size, n_inputs, n_steps])
            sess.run(train_op, feed_dict={xs: batch_x, ys: batch_y})

        print 'epoch:', epoch+1, 'accuracy:', sess.run(accuracy, feed_dict={xs: mnist.test.images.reshape([-1, n_steps, n_inputs]), ys: mnist.test.labels})

    end = time.time()
    print '*' * 30
    print 'training finish.\ncost time:',int(end-st), 'seconds\naccuracy:', sess.run(accuracy, feed_dict={xs: mnist.test.images.reshape([-1, n_steps, n_inputs]), ys: mnist.test.labels})

本文标题: TensorFlow练习3-RNNs实现分类

发布时间: 2017-01-02, 11:37:14

最后更新: 2021-12-16, 23:11:45

本文链接: http://shomy.top/2017/01/02/tensorflow-rnn-example-3/

非商业转载请注明作者及出处。商业转载请联系作者本人。