本文共 677 字,大约阅读时间需要 2 分钟。
"""=====================================标准化数据========================================"""# 一般特征之间有不同的量纲,如果不做处理,会造成数据间的差异很大,则涉及空间距离计算或者相似度计算时,需要对不同特征数据标准化# (1.)离差标准化:x=(x-min)/(max-min) 注意:1、当max= min 没有意义 2、min/max是否为异常值x_max = detail['amounts'].max()x_min = detail['amounts'].min()x = (detail['amounts'] - x_min) / (x_max - x_min)# print(x)# (2.)标准差标准化:x=(x-mean)/stdx_mean = detail['amounts'].mean()x_std = detail['amounts'].std()x1 = (detail['amounts'] - x_mean) / x_std# print(x1)# (3.)小数定标标准化数据 x=x/10`k 将所有的数都化为小数# 1、找到最大值 x.max()=10`k k=log10(|x|.max()):k可能是小数,向上取整k_max = abs(detail['counts']).max()k = np.ceil(np.log10(k_max))m = detail['counts'] / 10 ** k# print(m)
转载地址:http://qdwsi.baihongyu.com/