main content

数据的预处理 -凯发k8网页登录

数据的清理、平滑处理和分组

数据可能需要预处理技术,以确保准确、高效或有意义的分析。数据清洗指查找、删除和替换错误或缺失数据的方法。检测局部极值和突变有助于识别显著的数据趋势。平滑处理和去除趋势是从数据中消除噪声和多项式趋势的过程,而缩放则会改变数据的边界。分组和分 bin 方法按组识别数据特性。

app

preprocess and organize column-oriented data

实时编辑器任务

在实时编辑器中查找、填充或删除缺失数据
在实时编辑器中查找、填充或删除离群值
summarize, transform, or filter by group in the live editor
在实时编辑器中查找数据中的突然变化
在实时编辑器中求局部最大值和局部最小值
center and scale data in the live editor
在实时编辑器中对含噪数据进行平滑处理
在实时编辑器中去除数据中的多项式趋势

函数

determine if any array element is missing
查找缺失值
删除缺失的条目
填充缺失值
创建缺失值
插入标准缺失值
查找数据中的离群值
检测并替换数据中的离群值
检测并删除数据中的离群值
移动中位数绝对偏差
查找数据中的突然变化
计算局部最小值
计算局部最大值
对含噪数据进行平滑处理
移动均值
移动中位数
去除多项式趋势
find trends in data
归一化数据
数组元素的缩放范围
将数据划分为 bin 或类别
分组元素的数量
按组过滤
组汇总计算
按组转换
直方图 bin 计数
二元直方图 bin 计数
查找组并返回组编号
将数据划分归组并应用函数
apply function to table or timetable rows
apply function to table or timetable variables
累加向量元素

主题


  • 此示例演示了如何查找、清除和删除具有缺失数据的行。


  • 您可以使用分组变量对数据变量进行分类。


  • 以下示例演示如何进行数据分组以及如何对每个组应用统计量函数。


  • specify groups of data in tables and timetables, and perform calculations by group. choose a function for group calculations using these recommendations.

网站地图