2.1.3

请根据题目要求,在下方空白处填入正确的代码(点击 💡 按钮查看提示)

数据集说明
文件名:finance数据集.csv
Unnamed: 0SeriousDlqin2yrsRevolvingUtilizationOfUnsecuredLinesageNumberOfTime30-59DaysPastDueNotWorseDebtRatioMonthlyIncomeNumberOfOpenCreditLinesAndLoansNumberOfTimes90DaysLateNumberRealEstateLoansOrLinesNumberOfTime60-89DaysPastDueNotWorseNumberOfDependents
1.01.00.76612660945.02.00.8029821299120.013.00.06.00.02.0
2.00.00.95715101940.00.00.1218762012600.04.00.00.00.01.0
3.00.00.6581801438.01.00.0851133753042.02.01.00.00.00.0
4.00.00.23380977630.00.00.0360496823300.05.00.00.00.00.0
5.00.00.907239449.01.00.02492569563588.07.00.01.00.00.0
6.00.00.21317868274.00.00.3756069693500.03.00.01.00.01.0
7.00.00.30568246557.00.05710.08417.08.00.03.00.00.0
8.00.00.75446364839.00.00.2099400173500.08.00.00.00.00.0
10.00.00.18916905257.00.00.60629090123684.09.00.04.00.02.0
11.00.00.64422596230.00.00.309476212500.05.00.00.00.00.0
共 142577 条数据,仅展示前 10 条
代码填空
import pandas as pd # 加载数据 data = # 显示前五行的数据 print() import matplotlib.pyplot as plt import seaborn as sns # 设置图像尺寸 plt.figure(figsize=(12, 8)) # 识别数值列用于箱线图 numeric_cols = data.select_dtypes(include=['float64', 'int64']).columns # 创建箱线图 for i, col in enumerate(numeric_cols, 1): plt.subplot(3, 4, i) sns.boxplot(x=data[col]) plt.title(col) plt.tight_layout() plt.show() # 使用IQR处理异常值 Q1 = (0.25) Q3 = (0.75) IQR = # 移除异常值 data_cleaned = data[~((data[numeric_cols] < (Q1 - 1.5 * )) | (data[numeric_cols] > (Q3 + 1.5 * ))).any(axis=1)] # 检查处理重复值 duplicates = () num_duplicates = duplicates.sum() data_cleaned = data_cleaned[~duplicates] print(f'删除的重复行数: {num_duplicates}') #对数据进行归一化处理 from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler() data_cleaned[numeric_cols] = # 设定目标变量 target_variable = from sklearn.model_selection import train_test_split # 定义特征和目标 X = (columns=[]) #1分 y = #1分 # 划分数据(训练集占80%) X_train, X_test, y_train, y_test = (, random_state=42) # 显示划分后的数据形状 print(f'训练数据形状: {X_train.shape}') print(f'测试数据形状: {X_test.shape}') # 保存清洗后的数据到CSV cleaned_file_path = '2.1.3_cleaned_data.csv' (, index=False)
提示: