您当前的位置:网站首页>excel表格制作,玉皇大帝-科技图鉴|如果你的面试官是机器人

excel表格制作,玉皇大帝-科技图鉴|如果你的面试官是机器人

2019-05-21 08:20:50 投稿作者:admin 围观人数:192 评论人数:0次

问题:航班乘客猜测

数据:1949 到 1960 总共 12 年,每年 12 个月的数据,总共 144 个数据,单位是 1000

下载地址

方针:猜测国际航班未来 刀塔传奇1 个月的乘客数

import numpy
import matplotlib.pyplot as plt
from pandas import read_csv
import math
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import LSTM
from sklearn.preprocessing import MinMaxScaler
fr笑傲江湖吕颂贤版om sklearn.m芝麻etrics import mean_squared_error
%matplotlib inline

导入数据:

# load the dataset
dataframe = read_csv('international-airline-passengers.csv', usecols=[1], engine='python', skipfooter=3)
dataset = dataframe.values
# 将整型变为float
dataset = dataset.astexcel表格制造,玉皇大帝-科技图鉴|假如你的面试官是机器人ype('float32')
plt.plot(dataset)
plt.show()

从这 12 年的数据能够看到上升的趋势,每一年内的 12 个月里又有周期性季节性的规则

需求把数据做一下转化:

将一列变成两列,榜首列是 t 月的乘客数,第二列是 t+1 列的乘客数。

look_back 便是猜测下一步所需求的 tim塔卡沙是哪国的牌子e steps:

timesteps 便是 LSTM 以为每个输入数据与前多少个连续输入的数据有联络。例如具有这样用段序列数据 “…ABCDBCEDF…”,当 timesteps 为 3 时,在模型猜测中假如输入数据为“D”,那么之前接纳的数据假如为“B”和“C”则此刻的猜测输出为 B 的概率更大,之前接纳的数据假如为“C”和“E”,则此刻的猜测输出为 F 的概率更大。

# X is the number of passctticengers at a given time (t) and Y is the number of passengers at the next time (t + 1).
# convert an array of values into a dataset matrix
def creavvte_dataset(dataset, look_back=1):
dataX, dataY = [], []
for i in range(len(dataset)-look_back-1):
a = dataset[i:(i+look_back), 0]
dataX.append牛肚的做法大全(a)
dataY.append(dataset[excel表格制造,玉皇大帝-科技图鉴|假如你的面试官是机器人i + look_back, 0])
return numpy.array(dataX), numpy.array(dataYexcel表格制造,玉皇大帝-科技图鉴|假如你的面试官是机器人)
# fix random seed for reproducibility
numpy.random.seed(7)

当激活函excel表格制造,玉皇大帝-科技图鉴|假如你的面试官是机器人数为 sigmoid 或许 tanh 时,要把数据正则话,此刻 LSTM 比较灵敏

设定 67% 是练习数据,余下的是测验数据

# normalize the dataset
scaler = MinMaxScaler(香克斯feature_range=李左飞(0, 1))
dataset = scaler.fit_trans歌唱技巧和发声办法form(dataset)
# split into train an皇明风云录d test sets
train_size = int(len(dataset) * 0.67)
test_size = len(dataset) - train_size
train, test = dataset[0:train_size,:], dataset[train_size:len(dataset),:]

X=t and Y=t+1 时的数据,而且此刻的维度为 [samples, features]

# use this function to prepare the train and test datasets for modeling
look_back = 1
trainX, trainY = create_excel表格制造,玉皇大帝-科技图鉴|假如你的面试官是机器人dataset(train, look_back)
testX, testY = create_dataset(test, look_back)

投入到 LSTM 的 X 需求有这样的结构: [samples, time steps, features],所以做一下改换

# reshape input to be [samples, time steps, features]
trainX = numpy.reshape喷火蛙(trainX, (trainX.shape[0], 1, trainX.sh端木景晨的悉数著作ape[1]))
testX = numpy.reshape(testX, (testX.shape[0], 1, testX.shape[1]))

树立 LSTM 模型:

输入层有 1 个input,躲藏层有 4 个神经元,输出层便是猜测一个值,激活函数用 sigmoid,迭代 100 次,batch size 为 1

# create and fit the LSTM network
model = Sequential()
model.add(LSTM(4, input_shape=(1, look_back)))
model.add(Dense(1))
model.compile(loss='mean_squared_error', optimizer='adam')
model.fit(trainX, trainY, epochs=100, batch_size=1, verbose=2)

Epoch 100/100

1s - loss: 0.0020

猜测:

# make predictions
trainPredict = model.predict(trainX)
testPredict = model.predict(testX)

核算误差之前要先把猜测数据转换成同一单位

# invert predictions
trainPredict = scaler.inverse_transform(trainPredict)
trainY = scaler.inve贝尔摩德rse_transform([trainY])
testPredict = scaler.inverse_transform(testPredict)
testY = scaler.inverse_transform([tesexcel表格制造,玉皇大帝-科技图鉴|假如你的面试官是机器人tY])

核算 mean squared error

trainScore = math.sqrt(mean_squared_error(trainY[0], trainPredict[:,0]))
print('Train Score: %.2f RMSE' % (trainScore))
testScore = math.sqrt(mean_squared_error(testY[0], testPreexcel表格制造,玉皇大帝-科技图鉴|假如你的面试官是机器人dict[:,0]))
print('Test Score: %.2f RMSE' % (testScore))

Train Score: 22.92 RMSE

Test Score: 47.53 RMSE

画出成果:蓝颜色搭配色为原数据,绿色为练习集的猜测值,赤色为测验集的猜测值

# shift train pre王源身高dictions for plotting
trainPredictPlot = numpy.empty_like(dataset)
trainPredictPlot[:, :] = numpy.nan
trainPredictPlot[look_back:len(trainPredict)+look_back, :] = trainPredict
# shift test predictions for plotting
testPredictPlot = numpy.ecopympty_like(dataset)
testPredictPlot[:, :] = numpy.nan
testPredictPlot[len(trainPredict)+(look_back*2)+1:len(dataset)-1, :] = testPredict
# plot baseline and predictions
plt.plot(scaler.inverse_transforwithoutm(dataset))
plt.plot(trainPredictPlot)
plt.plot(testPredictPlot)
plt.show()

上面的成果并不是最佳的,仅仅举一个比如来看 LSTM 是如何做时刻序列的猜测的

能够改善的当地,最直接的 躲藏层的神经元个数是不是变为 128 更好呢,躲藏层数是不是能够变成 2 或许更多呢,time steps 假如变成 3 会不会好一点

别的感兴趣的筒子能够想想,RNN 做时刻序列的猜测究竟好不好呢

参考资料:

http://mach日驴inelearningmastery.com/time-series-prediction-lstm-recurrent-neural-networks-python-keras/

the end
科技图鉴|如果你的面试官是机器人