机器学习Estimator

作者: 编程技术  发布:2019-09-20

线性、逻辑回归。input_fn()创立不难七个特点列数据,用特证列API创设特征列。特征列传入LinearClassifier创立逻辑回归分类器,fit()、evaluate()函数,get_variable_names()得到全体模型变量名称。能够行使自定义优化函数,tf.train.FtrlOptimizer(),能够随便改造传到LinearClassifier。

私下森林。包罗三个决策树分类器及回归算法。管理不平衡分类资料集,比十分的大平衡误差。Kaggle数据正确比赛,延伸版XGBoost。

TensorForestEstimator,tensor_forest.ForestHParams设置随机森林参数,多少棵树、节点数目上限、特征种类数目。

传进TensorForestEstimator开首化随机森林Estimator。数据特征列、体种类转变到float32格式,保险TensorForestExtimator练习更快拟合。Scikit-learn风格fit()方法。

随机森林轻便过拟合,常用幸免过拟合方法是损失减少的进程变慢或完全停下滑坡,提前终止模型磨练。Monitor模块。random_forest模块自带LossMonitor。设定每隔100步Monitor检查损失收缩速度,三番五次97回迭代损失尚未减掉,Monitor停止任何模型陶冶。

K均值聚类。多维空间种种点划分到K个聚类,每种点属于离它这段日子均值对应聚类。NumPy创建适合做聚类数据。make_random_centers函数随机生成num_dims个维度数据汇集类num_centers个为主点。make_random_points函数依据变化聚类中央点随意生成num_points个点。生成一千0个点,6个随机聚类中央点。factorization模块KMeans初阶化聚类方法,随机伊始化RANDOM_INIT,传入RunConfig和、聚类核心数开首化KMeans Estimator对象,Scikit-learn风格fit()、predict()。KMeans clusters()函数看练习数据集每一种点聚类分布。KMeans Estimator,predict()预测新数总局聚类,score()预测各样点和不久前聚类距离总和,transform()计算每种点和模型决断聚类宗旨距离。

支撑向量机。各个分歧kernel或分化距离方程,针对不相同风味数据打造分化线性及非线性模型。同期最小化经验抽样误差与最大化几何边缘区,最大边缘区分类器。文本、图像分类。TF.Learn SVM Extimator API建构协理向量机模型。定义input_fn()组建有八个数据特征列、贰个ID列、一个标记列模拟数据。contrib.layers FeatureColumn API 将feature1、feature2转变方便Estimator的FeatureColumn。特征列、ID列传入SVM最早化协理向量机,参数调治。l1_regularization、l2_regularization加正规化幸免过于拟合难题(特征过多、例子十分少,轻巧产生)。fit()、predict()。

DataFrame。TF.Learn包罗独立DataFrame模块。类似Pandas、Spark、途锐编制程序语言DataFrame。提供TF.Learn读入数据迭代,读入种种数据类型(pandas.DataFrame、tensorflow.Example、NumPy),FeedingQueueRunner数据分批读入,存在Queue,方便Estimator模型陶冶。NumPy eye()建简易对角矩阵,TensorFlowDataFrame.from_numpy()把NumPy矩阵转为TensorFlow DataFrame。能够像Pandas读入各样文件类型。

用TensorFlowDataFrame读入文件或数据类型后,run()创制多少批量生成器,Python yield生成generator,生成器维持数据列名和数码字典mapping。调整number_batches选用生成batch数量,选择性用自个儿的graph、session,数据batch存到session coordinator。batch()重新改动batch大小。数据洗一回打乱顺序。split(),DataFrame分多个。select_rows()选用具体行数据。

监督器Monitors。TF.Learn自带Monitor,各样logging及监督调节练习进度。5个阶段log,严重性最小到最大排列,DEBUG、INFO、WA猎豹CS6N、E路虎极光RO兰德酷路泽、FATAL。选拔只打印设置等级或更要紧的log。TensorFlow私下认可log品级WA奥德赛N。模型磨练log,设INFO。CaptureVariable 钦赐变量值存款和储蓄到Collection。PrintTensor打字与印刷Tensor值。SummarySaver存款和储蓄Summary合同缓冲(Protocol Buffer)。ValidationMonitor训练打字与印刷多少个评估Metrics,监督模型陶冶,提前终止演练防止模型过度拟合。

TF.Learn自带learn.datasets.base.load_csv()读入CSV数据文件。定义评估模型metrics字典,contrib.metrics模块streaming_accuracy、streaming_precision、streaming_recall评估模型正确度、正确度、召回率。validation_metrics建立validation_monitor,提供评估数据及指标。提供every_n_steps指示每50步实行ValidationMonitor。validation_metrics传入metrics。early_stopping_netric提前终止监测metric。early_stopping_metric_minimize=True申明最小化前提供early_stopping_metric。early_stopping_rounds注明超越200步陶冶损失不减弱,ValidationMonitor结束Estimator磨炼。

创设深度神经网络分类器DNNClassifier,三层神经互连网,每层10、15、12个藏匿单元。分类器fit()钦定监督器validation_monitor,钦点多个监督器落成分裂作用监督,validation_monitor,debug_monitor,print_monitor。

evaluate()、predict(),新数据评估模型正确度。

TF.Learn生成log及checkpoint文件能够一贯读入TensorBoard可视化。

仿照效法资料:
《TensorFlow实战》

应接付费咨询,笔者的微信:qingxingfengzi

本文由贝博体育app发布于编程技术,转载请注明出处:机器学习Estimator

关键词:

上一篇:洛谷P4065 [JXOI2017]颜色(线段树)
下一篇:没有了