新消息丨Pandas数据连接pd.concat的实现
目录
1.按行连接2.按列连接3.合并交集扩展4.与序列合并5.指定索引Pandas数据可以实现纵向和横向连接,将数据连接后会形成一个新对象(Series或DataFrame)
连接是最常用的多个数据合并操作
pd.concat()是专门用于数据连接合并的函数,它可以沿着行或列进行操作,同时可以指定非合并轴的合并方式(如合集、交集等)
(资料图片仅供参考)
pd.concat()会返回一个合并后的DataFrame
语法
pd.concat(objs, axis=0, join="outer", ignore_index=False, keys=None, levels=None, names=None, sort=False, verify_integrity=False, copy=True)
参数
objs: 需要连接的数据,可以是多个DataFrame或者Series,它是必传参数axis: 连接轴的方法,默认值为0,即按行连接,追加在行后面;值为1时追加到列后面(按列连接:axis=1)join: 合并方式,其他轴上的数据是按交集(inner)还是并集(outer)进行合并ignore_index: 是否保留原来的索引keys: 连接关系,使用传递的键作为最外层级别来构造层次结构索引,就是给每个表指定一个一级索引names: 索引的名称,包括多层索引verify_integrity: 是否检测内容重复;参数为True时,如果合并的数据与原数据包含索引相同的行,则会报错copy: 如果为False,则不要深拷贝1.按行连接
pd.concat()的基本操作可以实现df.append()功能
操作中ignore_index和sort参数的作用是一样的,axis默认取值为0,即按行连接
import pandas as pd df1 = pd.DataFrame({"x":[1,2],"y":[3,4]}) df2 = pd.DataFrame({"x":[5,6],"y":[7,8]}) res1 = pd.concat([df1,df2]) # 效果同上 res2 = df1.append(df2)
df1
df2
res1
res2
2.按列连接
如果要将多个DataFrame按列拼接在一起,可以传入axis=1参数,这会将不同的数据追加到列的后面,索引无法对应的位置上将值填充为NaN
import pandas as pd df1 = pd.DataFrame({"x":[1,2],"y":[3,4]}) df2 = pd.DataFrame({"x":[5,6,0],"y":[7,8,0]}) res = pd.concat([df1,df2], axis=1)
df1
df2
res
该例子中,df2比df1多一行,合并后df1的部分为NaN
3.合并交集
上述两个练习案例的连接操作会得到两个表内容的并集(默认是join="outer")
合并交集需要将join参数进行改变 join="inner"
import pandas as pd df1 = pd.DataFrame({"x":[1,2],"y":[3,4]}) df2 = pd.DataFrame({"x":[5,6,0],"y":[7,8,0]}) # 按列合并交集 # 传入join="inner"取得两个DataFrame的共有部分,去除了df1没有的第三行内容 res = pd.concat([df1,df2], axis=1, join="inner")
df1
df2
res
扩展
通过reindex()方法也可以实现取交集功能
# 两种方法 res1 = pd.concat([df1,df2],axis=1).reindex(df1.index) res2 = pd.concat([df1,df2.reindex(df1.index)],axis=1)
res1
res2
4.与序列合并
import pandas as pd z = pd.Series([9,9],name="z") df = pd.DataFrame({"x":[1,2],"y":[3,4]}) # 将序列加到新列 res = pd.concat([df,z],axis=1)
z
df
res
5.指定索引
import pandas as pd df1 = pd.DataFrame({"x":[1,2],"y":[3,4]}) df2 = pd.DataFrame({"x":[5,6],"y":[7,8]}) # 指定索引名 res1 = pd.concat([df1,df2], keys=["a","b"]) # 以字典形式传入 dict = {"a":df1, "b":df2} res2 = pd.concat(dict) # 横向合并,指定索引 res3 = pd.concat([df1,df2], axis=1, keys=["a","b"])
df1
df2
res1
res2
res3
到此这篇关于Pandas数据连接pd.concat的实现的文章就介绍到这了,更多相关Pandas数据连接pd.concat内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
X 关闭
X 关闭
- 1转转集团发布2022年二季度手机行情报告:二手市场“飘香”
- 2充电宝100Wh等于多少毫安?铁路旅客禁止、限制携带和托运物品目录
- 3好消息!京东与腾讯续签三年战略合作协议 加强技术创新与供应链服务
- 4名创优品拟通过香港IPO全球发售4100万股 全球发售所得款项有什么用处?
- 5亚马逊云科技成立量子网络中心致力解决量子计算领域的挑战
- 6京东绿色建材线上平台上线 新增用户70%来自下沉市场
- 7网红淘品牌“七格格”chuu在北京又开一家店 潮人新宠chuu能红多久
- 8市场竞争加剧,有车企因经营不善出现破产、退网、退市
- 9北京市市场监管局为企业纾困减负保护经济韧性
- 10市场监管总局发布限制商品过度包装标准和第1号修改单