目录
python DataFrame的合并方法#concat函数#merge函数#append函数把两个dataframe合并成一个python DataFrame的合并方法
Python的Pandas针对DataFrame,Series提供了多个合并函数,通过参数的调整可以轻松实现DatafFrame的合并。
【资料图】
首先,定义3个DataFrame df1,df2,df3,进行concat、merge、append函数的实验。
df1=pd.DataFrame([[1,2,3],[2,3,4]],columns=["a","b","c"]) df2=pd.DataFrame([[2,3,4],[3,4,5]],columns=["a","b","c"]) df3=pd.DataFrame([[1,2,3],[2,3,4]],columns=["a","b","d"])
df1 a b c 0 1 2 3 1 2 3 4 df2 a b c 0 2 3 4 1 3 4 5 df3 a b d 0 1 2 3 1 2 3 4
#concat函数
pandas中concat函数的完整表达,包含多个参数,常用的有axis,join,ignore_index.
concat函数的第一个参数为objs,一般为一个list列表,包含要合并两个或多个DataFrame,多个Series
pandas.concat(objs, axis=0, join="outer", join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True)
1.axis表示合并方向,默认axis=0,两个DataFrame按照索引方向纵向合并,axis=1则会按照columns横向合并。
pd.concat([df1,df2],axis=1) a b c a b c 0 1 2 3 2 3 4 1 2 3 4 3 4 5
2.join表示合并方式,默认join=‘outer’,另外的取值为’inner’,只合并相同的部分,axis=0时合并结果为相同列名的数据,axis=1时为具有相同索引的数据
pd.concat([df2,df3],axis=0,join="inner") a b 0 2 3 1 3 4 0 1 2 1 2 3 pd.concat([df2,df3],axis=1,join="inner") a b c a b d 0 2 3 4 1 2 3 1 3 4 5 2 3 4
3.ignore_index表示索引的合并方式,默认为False,会保留原df的索引,如果设置ignore_index=True,合并后的df会重置索引。
pd.concat([df1,df2],ignore_index=True) a b c 0 1 2 3 1 2 3 4 2 2 3 4 3 3 4 5
#merge函数
merge函数是pandas提供的一种数据库式的合并方法。
on可以指定合并的列、索引,how则是与数据库join函数相似,取值为left,right,outer,inner.left,right分别对应left outer join, right outer join.
pandas.merge(left, right, how="inner", on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=("_x", "_y"), copy=True, indicator=False, validate=None):
merge函数可以通过pandas.merge(df1,df2)、df1.merge(df2)两种形式来实现两个DataFrame的合并,df1.merge(df2)是默认left=self的情况。
df_merge =df1.merge(df3,on=["a","b"]) a b c d 0 1 2 3 3 1 2 3 4 4
#append函数
append函数是pandas针对DataFrame、Series等数据结构合并提供的函数。
df1.append(self, other, ignore_index=False, verify_integrity=False)
df1.append(df2)与pd.concat([df1,df2],ignore_index=False)具有相同的合并结果
df1.append(df2) a b c 0 1 2 3 1 2 3 4 0 2 3 4 1 3 4 5
更多使用方法可以参考pandas关于数据合并的官方文档http://pandas.pydata.org/pandas-docs/stable/merging.html
把两个dataframe合并成一个
1.merage
result = pd.merge(对象1, 对象2, on="key")
对象1 和 对象2分别为要合并的dataframe,key是在两个dataframe都存在的列(类似于数据库表中的主键)
2.append
result = df1.append(df2) result = df1.append([df2, df3]) result = df1.append(df4, ignore_index=True)
3.join
result = left.join(right, on=["key1", "key2"], how="inner")
4.concat
pd.concat(objs, axis=0, join="outer", join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True) frames = [df1, df2, df3] result = pd.concat(frames) result = pd.concat(frames, keys=["x", "y", "z"]) result = pd.concat([df1, df4], ignore_index=True)
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。
X 关闭
X 关闭
- 1转转集团发布2022年二季度手机行情报告:二手市场“飘香”
- 2充电宝100Wh等于多少毫安?铁路旅客禁止、限制携带和托运物品目录
- 3好消息!京东与腾讯续签三年战略合作协议 加强技术创新与供应链服务
- 4名创优品拟通过香港IPO全球发售4100万股 全球发售所得款项有什么用处?
- 5亚马逊云科技成立量子网络中心致力解决量子计算领域的挑战
- 6京东绿色建材线上平台上线 新增用户70%来自下沉市场
- 7网红淘品牌“七格格”chuu在北京又开一家店 潮人新宠chuu能红多久
- 8市场竞争加剧,有车企因经营不善出现破产、退网、退市
- 9北京市市场监管局为企业纾困减负保护经济韧性
- 10市场监管总局发布限制商品过度包装标准和第1号修改单