目录
模拟数据1、mapdemo实际数据2、applydemoapply实现需求3、applymapDF数据加1保留2位有效数字实际工作中,我们在利用 pandas进行数据处理的时候,经常会对数据框中的单行、多行(列也适用)甚至是整个数据进行某种相同方式的处理,比如将数据中的 sex字段将 男替换成1,女替换成0。
在这个时候,很容易想到的是 for循环。用 for循环是一种很简单、直接的方式,但是运行效率很低。本文中介绍了 pandas中的三大利器: map、apply、applymap 来解决上述同样的需求。
mapapplyapplymap模拟数据
通过一个模拟的数据来说明3个函数的使用,在这个例子中学会了如何生成各种模拟数据。数据如下:
import pandas as pd import numpy as np boolean = [True, False] gender = ["男","女"] color = ["white","black","red"] # 好好学习如何生成模拟数据:非常棒的例子 # 学会使用random模块中的randint方法 df = pd.DataFrame({"height":np.random.randint(160,190,100), "weight":np.random.randint(60,90,100), "smoker":[boolean[x] for x in np.random.randint(0,2,100)], "gender":[gender[x] for x in np.random.randint(0,2,100)], "age":np.random.randint(20,60,100), "color":[color[x] for x in np.random.randint(0,len(color),100)] }) df.head()
1、map
demo
map() 会根据提供的函数对指定序列做映射。
第一个参数 function 以参数序列中的每一个元素调用 function 函数,返回包含每次 function 函数返回值的新列表。
map(function, iterable)
实际数据
将gender中男变成1,女变成0
# 方式1:通过字典映射实现 dic = {"男":1, "女":0} # 通过字典映射 df1 = df.copy() # 副本,不破坏原来的数据df df1["gender"] = df1["gender"].map(dic) df1 # 方式2:通过函数实现 def map_gender(x): gender = 1 if x == "男" else 0 return gender df2 = df.copy() # 将df["gender"]这个S型数据中的每个数值传进去 df2["gender"] = df2["gender"].map(map_gender) df2
2、apply
apply方法的作用原理和 map方法类似,区别在于 apply能够传入功能更为复杂的函数,可以说 apply是 map的高级版
pandas 的 apply() 函数可以作用于 Series 或者整个 DataFrame,功能也是自动遍历整个 Series 或者 DataFrame, 对每一个元素运行指定的函数。
在 DataFrame对象的大多数方法中,都会有 axis这个参数,它控制了你指定的操作是沿着0轴还是1轴进行。 axis=0代表操作对 列columns进行, axis=1代表操作对 行row进行
demo
上面的数据中将age字段的值都减去3,即加上-3
def apply_age(x,bias): return x + bias df4 = df.copy() # df4["age"]当做第一个值传给apply_age函数,args是第二个参数 df4["age"] = df4["age"].apply(apply_age,args=(-3,))
计算BMI指数
# 实现计算BMI指数:体重/身高的平方(kg/m^2) def BMI(x): weight = x["weight"] height = x["height"] / 100 BMI = weight / (height **2) return BMI df5 = df.copy() df5["BMI"] = df5.apply(BMI,axis=1) # df5现在就相当于BMI函数中的参数x;axis=1表示在列上操作 df5
DataFrame型数据的 apply操作总结:
当 axis=0时,对 每列columns执行指定函数;当 axis=1时,对 每行row执行指定函数。无论 axis=0还是 axis=1,其传入指定函数的默认形式均为 Series,可以通过设置 raw=True传入 numpy数组。对每个Series执行结果后,会将结果整合在一起返回(若想有返回值,定义函数时需要 return相应的值)apply实现需求
通过apply方法实现上面的性别转换需求。apply方法中传进来的第一个参数一定是函数
3、applymap
DF数据加1
applymap函数用于对DF型数据中的每个元素执行相同的函数操作,比如下面的加1:
保留2位有效数字
到此这篇关于详解Pandas的三大利器(map,apply,applymap)的文章就介绍到这了,更多相关Pandas map apply applymap内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
X 关闭
X 关闭
- 15G资费不大降!三大运营商谁提供的5G网速最快?中国信通院给出答案
- 2联想拯救者Y70发布最新预告:售价2970元起 迄今最便宜的骁龙8+旗舰
- 3亚马逊开始大规模推广掌纹支付技术 顾客可使用“挥手付”结账
- 4现代和起亚上半年出口20万辆新能源汽车同比增长30.6%
- 5如何让居民5分钟使用到各种设施?沙特“线性城市”来了
- 6AMD实现连续8个季度的增长 季度营收首次突破60亿美元利润更是翻倍
- 7转转集团发布2022年二季度手机行情报告:二手市场“飘香”
- 8充电宝100Wh等于多少毫安?铁路旅客禁止、限制携带和托运物品目录
- 9好消息!京东与腾讯续签三年战略合作协议 加强技术创新与供应链服务
- 10名创优品拟通过香港IPO全球发售4100万股 全球发售所得款项有什么用处?