Pandas DataFrame进行数据拼接方法详解

2025-11-06 09:50 开发作者： Humbunklung

1.concat()：沿轴拼接多个DataFrame

适用于结构相似的数据集（相同列或相同索引），支持纵向（行）或横向（列）拼接。

参数关键点

axis=0（默认）：纵向拼接（增加行）；axis=1：横向拼接（增加列）。
join='outer'：保留所有行列（缺值填NaN）；join='inner'：仅保留共有行列。
ignore_index=True：重置索引，避免重复。
keys：添加分层索引，标记来源。

代码示例

import pandas as pd

# 纵向拼接（行追加）
df1 = pd.DataFrame({'A': ['A0', 'A1'], 'B': ['B0', 'B1']})
df2 = pd.DataFrame({'A': ['A2', 'A3'], 'B': ['B2', 'B3']})
result_vertical = pd.concat([df1, df2], ignore_index=True)

结果如下：

	A	B
0	A0	B0
1	A1	B1
2	A2	B2
3	A3	B3

# 横向拼接（列合并）
df3 = pd.DataFrame({'C': ['C0', 'C1'], 'D': ['D0', 'D1']}, index=[0,1])
result_horizontal = pd.concat([df1, df3], axis=1)

结果如下：

	A	B	C	D
0	A0	B0	C0	D0
1	A1	B1	C1	D1

2.merge()：基于键值合并（类似SQL JOIN）

适用于关联不同结构的数据集，通过共享列（键）连接。

参数关键点

how：连接方式（inner、left、right、outer）。
on：指定连接键列名；left_on/right_on：左右表键名不同时使用。
left_index/right_index=True：用索引作为连接键。

代码示例

# 内连接（javascript保留共有键）
left = pd.DataFrame({'key': ['K0', 'K1'], 'A': ['A0', 'A1']})
right = pd编程客栈.DataFrame({'key': ['K0', 'K2'], 'B': ['B0', 'B2']})
result_inner = pd.merge(left, right, on='key', how='inner')

结果如下：

	key	A	B
0	K0	A0	B0

# 外连接（保留所有键，缺值填NaN）
result_outer = pd.merge(left, right, on='key', how='outer')

result_outer

结果如下：

	key	A	B
0	K0	A0	B0
1	K1	A1	NaN
2	K2	NaN	B2

3.join()：基于索引快速连接

merge的简php化版，默认按索引拼接，适合索引对齐的场景。

参数关键点

how：连接方式（默认左连接）。
lsuffix/rsuffix：左右表列名冲突时添加后缀。

代码示例

left_df = pd.DataFrame({'value': [1, 2]}, index=['A', 'B'])
right_df = pd.DataFrame({'value': [7, 8]}, index=['A', 'C'])
joined = left_df.join(right_df, how='inner', lsuffix='_left', rsuffix='_right')

joined

结果如下：

	value_left	value_right
A	1	7

4.combine_first()：填充缺失值

用第二个DataFrame的非空值补全第一个DataFrame的NaN，适合数据补全。

代码示例

df1 = pd.DataFrame({'A': [1, None, 3], 'B': [4, 5, None]}, index=['X', 'Y', 'Z'])
df2 = pd.DataFrame({'A': [None, 10, 11], 'B': [7, 8, 9]}, indejsx=['Y', 'Z', 'W'])
filled = df1.combine_first(pythondf2)

filled

结果如下：

	A	B
W	11.0	9.0
X	1.0	4.0
Y	NaN	5.0
Z	3.0	8.0

性能与场景对比

方法	适用场景	性能优势
`concat()`	同构数据批量拼接（行/列扩展）	⭐⭐⭐⭐（高效批处理）
`merge()`	异构数据关联（类似SQL JOIN）	⭐⭐⭐（灵活但稍慢）
`join()`	索引对齐的快速合并	⭐⭐⭐⭐（索引优化）
`combine_first()`	缺失值填充（非拼接主导）	⭐⭐

高效建议：

批量纵向拼接优先用concat(ignore_index=True)；
关联查询用merge并明确指定on键；
避免已弃用的append()，用concat替代。

通过以上方法，可灵活应对DataFrame拼接需求，平衡效率与功能。

到此这篇关于Pandas DataFrame进行数据拼接方法详解的文章就介绍到这了,更多相关Pandas DataFrame数据拼接内容请搜索编程客栈(www.devze.com)以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程客栈(www.devze.com)！

继续阅读：Pandas DataFrame Pandas DataFrame数据拼接 Python Pandas

Pandas DataFrame进行数据拼接方法详解

目录

1.concat()：沿轴拼接多个DataFrame

参数关键点

代码示例

2.merge()：基于键值合并（类似SQL JOIN）

参数关键点

代码示例

3.join()：基于索引快速连接

参数关键点

代码示例

4.combine_first()：填充缺失值

代码示例

性能与场景对比

更多精彩内容

精彩评论

最新开发

Go语言中:= 运算符短变量声明的使用小结

go无缓冲通道的实现及应用

golang循环变量捕获问题的解决

Go语言创建结构体实例对象的几种常用方式

C++二叉搜索树图片及代码详解

开发排行榜

springboot后端存储富文本内容的思路与步骤(含图片内容)

PyCharm运行python测试,报错“没有发现测试”/“空套件”的解决

return base64.b64encode(b).decode(

基于C语言实现钻石棋游戏的示例代码

Sublime Text 3解决中文乱码问题（实测可用）

目录

1.concat()：沿轴拼接多个DataFrame

参数关键点

代码示例

2.merge()：基于键值合并（类似SQL JOIN）

参数关键点

代码示例

3.join()：基于索引快速连接

参数关键点

代码示例

4.combine_first()：填充缺失值

代码示例

性能与场景对比

更多精彩内容

精彩评论

最新开发

Go语言中:= 运算符短变量声明的使用小结

go无缓冲通道的实现及应用

golang循环变量捕获问题​​的解决

Go语言创建结构体实例对象的几种常用方式

C++二叉搜索树图片及代码详解

开发排行榜

springboot后端存储富文本内容的思路与步骤(含图片内容)

PyCharm运行python测试,报错“没有发现测试”/“空套件”的解决

return base64.b64encode(b).decode(

基于C语言实现钻石棋游戏的示例代码

Sublime Text 3解决中文乱码问题（实测可用）

golang循环变量捕获问题的解决