1.1.5 车辆交通数据分析

请根据题目要求,在下方空白处填入正确的代码(点击 💡 按钮查看提示)

数据集说明
文件名:vehicle_traffic_data.csv
VehicleIDDriverNameAgeGenderSpeedTravelDistanceTravelTimeTrafficEvent
1Driver_162Male17242854.1176471Normal
2Driver_265Male128438205.3125Accident
3Driver_318Male167792284.5508982Breakdown
4Driver_421Male389991577.368421Traffic Jam
5Driver_521Male193364113.1606218Breakdown
6Driver_657Female48620775Accident
7Driver_727Female45535713.3333333Normal
8Driver_837Male122349171.6393443Breakdown
9Driver_939Male1774414.91525424Accident
10Driver_1068Male22719.09090909Breakdown
共 1000 条数据,仅展示前 10 条
1. 数据采集
import pandas as pd import numpy as np import matplotlib.pyplot as plt # 从本地文件中读取数据 2分 data = print("数据采集完成,已加载到DataFrame中") # 打印数据的前5条记录 2分 print()
2. 数据清洗与预处理
# 处理缺失值(删除) 2分 data = # 数据类型转换 data = (int) #Age数据类型转换为int 1分 data = (float) #Speed数据类型转换为float 1分 data = (float) #TravelDistance数据类型转换为float 1分 data = (float) #TravelTime数据类型转换为float 1分 # 处理异常值 2分 data = data[((18, 70)) & ((0, 200)) & ((1, 1000)) & ((1, 1440))] # 保存清洗后的数据 1分 ('cleaned_vehicle_traffic_data.csv', index=False) print("数据清洗完成,已保存为 'cleaned_vehicle_traffic_data.csv'")
3. 数据合理性审核
# 审核字段合理性 1分 unreasonable_data = data[~(((18, 70)) & ((0, 200)) & ((1, 1000)) & ((1, 1440)))] print("不合理的数据:\n", unreasonable_data)
4. 数据统计
# 统计每种交通事件的发生次数 2分 traffic_event_counts = print("每种交通事件的发生次数:\n", traffic_event_counts) # 统计不同性别的平均车速、行驶距离和行驶时间 2分 gender_stats = data.. print("不同性别的平均车速、行驶距离和行驶时间:\n", gender_stats) # 统计不同年龄段的驾驶员数 5分 age_bins = [18, 26, 36, 46, 56, 66, np.inf] age_labels = ['18-25', '26-35', '36-45', '46-55', '56-65', '65+'] data['AgeGroup'] = (, , , right=False) age_group_counts = print("不同年龄段的驾驶员数:\n", age_group_counts)
提示: