安全审计之Pandas常用代码
0x00 前言
在审计中除了使用Excel和SQL来进行处理分析一些数据,也会经常用到Pandas来做一些分析,而使用Pandas做分析的定位主要分为两点:1、当数据量过大的时候,普通Excel已经很难便捷的进行审计分析;2、当审计场景已经流程化,则需要固话成自动化的时候。
以下是我收集整理的代码组合,代码非原创(我是代码搬运工)。
0x01 常用的代码组合
1. 数据去重:
1 |
|
2. 透视表 - pivot_table:
1 |
|
3. 筛选透视表中值大于1的数据,并排序:
1 |
|
4. 按索引值进行合并两张表
1 |
|
5. 两个Excel表进行合并
1 |
|
6. 筛选匹配固定字符内容
1 |
|
7. 导入相关日志文件
1 |
|
8. 导出相关审计结果
1 |
|
9. 筛选大于或小于某时间节点数据
1 |
|
10. 解决主账号ID或从账号ID中存在空格的情况
1 |
|
11. 删除某条或某规则下数据
1 |
|
12. 单字段进行去重
1 |
|
13. 重复数据与现有数据统计
1 |
|
14. 删除某行或某列或某条件下数据
1 |
|
15. 导入某文件夹中同类型数据文件
1 |
|
16. 处理操作日志中重复数据
1 |
|
17. 合并字段
1 |
|
18. 重命名字段
1 |
|
19. 对日志中某字段数进行排序并筛选大于某值的数据
1 |
|
20. 部分取值相关代码
1 |
|
21. Pandas链接数据库
1 |
|
22. 统计处理时长
1 |
|
23. 读取第一行做表头,指定添加字段名称
1 |
|
24. 读取excel的所有sheet名
1 |
|
25. 读取多个sheet合并到一个文件夹
1 |
|
26. 将目录下所有excel的所有sheet读取并合到一张表
1 |
|
0x02 其它功能性代码组合
1. 对某列的内容分列
1 |
|
2. 设置单元格条件格式1—指定值字体变色、指定值设置背景色
1 |
|
3. 设置单元格条件格式2—迷你条形图、用颜色深浅表示值大小
1 |
|
4. 更改DataFrame的某些值
1 |
|
5. 插入新增列、行
1 |
|
6. Series、DataFrame数据的loc、iloc、ix 查询 / 读取
1 |
|
6.1 代码部分:
1 |
|
0x03 基础代码含义大全 ①
1. 创建空DataFrame
1 |
|
2. 判断DataFrame是否为空
1 |
|
3. DataFrame去重
1 |
|
4. 替换DataFrame中指定字符串
1 |
|
5. 填充DataFrame中Nan
1 |
|
6. 重塑DataFrame
1 |
|
7. DataFrame每列数据类型
1 |
|
8. DataFrame行数列数
1 |
|
9. DataFrame列名
1 |
|
10. 修改列名
1 |
|
11. 删除列
1 |
|
12. 增加列
1 |
|
13. 某列转换成int类型
1 |
|
14. 选出某列转List
1 |
|
15. 对每列求和
1 |
|
16. 按多列排序
1 |
|
17. 某列最小值
1 |
|
18. Union ALL
1 |
|
19. Left/Right/Inner/Outer Join
1 |
|
20. 筛选数据
1 |
|
21. 分组排序聚合
1 |
|
22. List-Tuple转DataFrame
1 |
|
23. List-List转DataFrame
1 |
|
24. List-Dict转DataFrame
1 |
|
25. excel转DataFrame
1 |
|
26. Csv文件转DataFrame
1 |
|
27. Json文件转DataFrame
1 |
|
28. DataFrame保存成Csv文件
1 |
|
29. DataFrame保存成Json文件
1 |
|
30. Sql执行结果转DataFrame
1 |
|
0x04 基础代码含义大全 ②
1. 引用库和pandas结构缩写
1 |
|
2. 数据导入
1 |
|
3. 数据导出
1 |
|
4. 数据查看与验证
1 |
|
5. 数据的选取
1 |
|
6. 数据清洗
1 |
|
7. 数据过滤、排序、分组
1 |
|
8. 数据的连接、组合
1 |
|
9. 数据统计
1 |
|
0x05 结尾语
以上是收集整理的,经常会用到的代码公式,还有可能会用到的一些代码函数。