博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
pandas数据预处理之标准化数据
阅读量:4101 次
发布时间:2019-05-25

本文共 677 字,大约阅读时间需要 2 分钟。

"""=====================================标准化数据========================================"""# 一般特征之间有不同的量纲,如果不做处理,会造成数据间的差异很大,则涉及空间距离计算或者相似度计算时,需要对不同特征数据标准化# (1.)离差标准化:x=(x-min)/(max-min)  注意:1、当max= min 没有意义 2、min/max是否为异常值x_max = detail['amounts'].max()x_min = detail['amounts'].min()x = (detail['amounts'] - x_min) / (x_max - x_min)# print(x)# (2.)标准差标准化:x=(x-mean)/stdx_mean = detail['amounts'].mean()x_std = detail['amounts'].std()x1 = (detail['amounts'] - x_mean) / x_std# print(x1)# (3.)小数定标标准化数据 x=x/10`k  将所有的数都化为小数# 1、找到最大值 x.max()=10`k  k=log10(|x|.max()):k可能是小数,向上取整k_max = abs(detail['counts']).max()k = np.ceil(np.log10(k_max))m = detail['counts'] / 10 ** k# print(m)

转载地址:http://qdwsi.baihongyu.com/

你可能感兴趣的文章
最小二乘法拟合:原理,python源码,C++源码
查看>>
ubuntu 安装mysql
查看>>
c# 计算器
查看>>
C# 简单的矩阵运算
查看>>
gcc 常用选项详解
查看>>
c++输入文件流ifstream用法详解
查看>>
c++输出文件流ofstream用法详解
查看>>
字符编码:ASCII,Unicode 和 UTF-8
查看>>
QT跨MinGW和MSVC两种编译器的解决办法
查看>>
firewalld的基本使用
查看>>
Linux下SVN客户端使用教程
查看>>
i2c-tools
查看>>
Linux分区方案
查看>>
nc 命令详解
查看>>
如何使用 systemd 中的定时器
查看>>
git命令速查表
查看>>
linux进程监控和自动重启的简单实现
查看>>
OpenFeign学习(三):OpenFeign配置生成代理对象
查看>>
OpenFeign学习(四):OpenFeign的方法同步请求执行
查看>>
OpenFeign学习(五):OpenFeign请求结果处理及重试控制
查看>>