首页 体育 教育 财经 社会 娱乐 军事 国内 科技 互联网 房产 国际 女人 汽车 游戏

数据分析神器

2019-12-20

在 30 秒内,完结你悉数的规范数据剖析,这便是用 Pandas 进行数据剖析发生的“奇观”。

Pandas 是 Python 中处理数据的首选库,它运用起来很简单,十分灵敏,能够处理不同类型和巨细的数据,并且它有很多的 函数 ,这让操作数据简直是小菜一碟。

用 Python 处理过数据的人大约对 pandas 不生疏。

假如想处理行或列排序的格式化数据,大多数情况下,你能够运用 pandas 处理。假如没装置 pandas,能够用你喜爱的指令终端装置,必定要用 pip 指令:

 仿制代码

pipinstallpandas

现在,让咱们看看默许的 pandas 完成都能够做什么:

咱们解释一下上面代码和输出的意义:

Pandas 的任何“数据帧”都有一个 describe 办法,这个办法会回来上面的输出。但请注意,这个办法的以上输出数据中,关于类别的变量漏掉了。在上面的比如中,输出信息里,“ method ”这一列被彻底移除。

让咱们看看是否能做得更好。

假如我告知你,我仅用 3 行 Python 代码即可生成以下计算数据,你会感觉怎么:

运用 Pandas Profiling 包,咱们仅用 1 行代码就能够得到以上数据!在指令行终端只需运用 pip 即可装置 Pandas Profiling 包:

 仿制代码

pipinstallpandas_profiling

乍一看,经验丰富的数据剖析师可能会讪笑这是虚有其表的,可是,它能够协助你快速取得你具有的数据概略:

你看到的榜首部分内容是“ 概览 ”,这部分内容会出现给你一些十分高档的数据和变量计算,以及像变量高相关性和高偏态性等这类 正告 。

可是它供给的信息远远不止这些。往下滑动,咱们会发现这份输出陈述包括多个部分。仅用图片显现这个 1 行代码的输出都是不大适宜的,所以我制作了一张 GIF 图:

我强烈建议你自己来探究这个软件包里的特征——究竟,这只有 1 行代码,并且你会在今后的数据剖析中发现这个软件包真的很好用。

 仿制代码

import pandasaspd
import pandas_profiling
pd.read_csv.profile_report

假如你喜爱运用这些易用的东西来改善你的 Python 工作流,能够看看我的 一些最新文章 。

这篇文章真的很矮小。我自己才刚刚发现 Pandas Profiling 这个库,觉得能够拿来共享!

Exploring your data with just 1 line of Python

热门文章

随机推荐

推荐文章