确保你已经安装了以下库:

pandas:用于数据处理。

openpyxl:用于读写Excel文件。

numpy:用于数值计算。

matplotlib 和 seaborn:用于数据可视化。

你可以使用以下命令安装这些库:

pip install pandas openpyxl numpy matplotlib seaborn
脚本列表

读取Excel文件

写入Excel文件

筛选特定列

筛选特定行

删除空值

填充空值

重命名列

计算总和

计算平均值

计算最大值

计算最小值

计算标准差

计算百分比变化

计算累计和

计算同比增长

计算环比增长

数据透视表

合并多个Excel文件

拆分Excel文件

格式化日期

按日期排序

按多个列排序

分组求和

分组计数

分组平均值

条件筛选

条件替换

添加新列

删除列

删除行

查找重复值

删除重复值

数据归一化

数据标准化

绘制折线图

绘制柱状图

绘制饼图

绘制箱线图

绘制散点图

绘制热力图

计算复利

计算现值

计算未来值

计算内部收益率(IRR)

计算净现值(NPV)

计算投资回报率(ROI)

计算年化收益率

计算资产负债表比率

计算利润表比率

计算现金流量表比率‍

financial_data.xlsx 数据示例

假设我们有一个简单的财务数据表,包含以下列:

Date:日期

Category:类别(例如:销售、服务、其他)

Revenue:收入

Cost:成本

Profit:利润(收入 - 成本)

示例数据

创建 financial_data.xlsx 文件

你可以使用以下Python代码创建并保存这个Excel文件:

import pandas as pd
from datetime import datetime, timedelta
# 创建示例数据
data = {
    'Date': [datetime(2023, 1, 1) + timedelta(days=i) for i in range(10)],
    'Category': ['销售', '服务', '销售', '其他', '服务', '销售', '其他', '服务', '销售', '其他'],
    'Revenue': [1000, 800, 1200, 500, 900, 1100, 600, 1000, 1300, 700],
    'Cost': [600, 500, 700, 300, 400, 650, 350, 500, 700, 400],
    'Profit': [400, 300, 500, 200, 500, 450, 250, 500, 600, 300]
}
# 创建DataFrame
df = pd.DataFrame(data)
# 保存为Excel文件
df.to_excel('financial_data.xlsx', index=False)
print("financial_data.xlsx 已创建")

运行上述代码

运行上述代码后,会在当前目录下生成一个名为 financial_data.xlsx 的Excel文件,其中包含示例数据。

1. 读取Excel文件

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
print(df)

2. 写入Excel文件

import pandas as pd
# 创建一个DataFrame
data = {'Date': ['2023-01-01', '2023-01-02', '2023-01-03'],
        'Revenue': [100, 150, 200]}
df = pd.DataFrame(data)
# 写入Excel文件
df.to_excel('output.xlsx', index=False)

3. 筛选特定列

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 筛选特定列
selected_columns = df[['Date', 'Revenue']]
print(selected_columns)

4. 筛选特定行

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 筛选特定行
filtered_rows = df[df['Revenue'] > 100]
print(filtered_rows)

5. 删除空值

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 删除包含空值的行
df_cleaned = df.dropna()
print(df_cleaned)

6. 填充空值


import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 填充空值
df_filled = df.fillna(0)
print(df_filled)

7. 重命名列

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 重命名列
df_renamed = df.rename(columns={'OldName': 'NewName'})
print(df_renamed)

8. 计算总和

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 计算总和
total = df['Revenue'].sum()
print(f'Total Revenue: {total}')

9. 计算平均值

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 计算平均值
average = df['Revenue'].mean()
print(f'Average Revenue: {average}')

10. 计算最大值

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 计算最大值
max_value = df['Revenue'].max()
print(f'Max Revenue: {max_value}')

11. 计算最小值

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 计算最小值
min_value = df['Revenue'].min()
print(f'Min Revenue: {min_value}')

12. 计算标准差

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 计算标准差
std_dev = df['Revenue'].std()
print(f'Standard Deviation of Revenue: {std_dev}')

13. 计算百分比变化

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 计算百分比变化
df['Pct_Change'] = df['Revenue'].pct_change()
print(df)

14. 计算累计和

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 计算累计和
df['Cumulative_Sum'] = df['Revenue'].cumsum()
print(df)

15. 计算同比增长

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 计算同比增长
df['YoY_Growth'] = df['Revenue'].pct_change(periods=12) * 100
print(df)

16. 计算环比增长

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 计算环比增长
df['MoM_Growth'] = df['Revenue'].pct_change() * 100
print(df)

17. 数据透视表

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 创建数据透视表
pivot_table = pd.pivot_table(df, values='Revenue', index='Category', aggfunc='sum')
print(pivot_table)

18. 合并多个Excel文件

import pandas as pd
import glob
# 获取所有Excel文件
files = glob.glob('*.xlsx')
# 读取并合并所有Excel文件
all_data = pd.concat([pd.read_excel(file) for file in files], ignore_index=True)
print(all_data)

19. 拆分Excel文件

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 按类别拆分
for category, group in df.groupby('Category'):
    group.to_excel(f'{category}.xlsx', index=False)

20. 格式化日期

import pandas as pd
# 读取Excel文件
df = pd.read_excel('financial_data.xlsx')
# 将日期列转换为日期时间格式
df['Date'] = pd.to_datetime(df['Date'])
print(df)

 

点赞(0) 打赏
立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部