2.1.2

请根据题目要求,在下方空白处填入正确的代码(点击 💡 按钮查看提示)

数据集说明
文件名:大学生低碳生活行为的影响因素数据集.xlsx
序号所用时间1.您的性别○男性 ○女性2.您的年级○大一 ○大二 ○大三 ○大四3.您的生源地○农村 ○城镇(乡镇) ○地县级城市 ○省会城市及直辖市4.您的月生活费○≦1,000元 ○1,001-2,000元 ○2,001-3,000元 ○≧3,001元5.您进行过绿色低碳的相关生活方式吗?6.您觉得“低碳”,与你的生活关系密切吗?7.低碳生活是否会成为未来的主流生活方式?8.您是否认为低碳生活会提高您的生活质量?9.您从以下哪种途径获取有关于“低碳”的信息?(电视广播传媒)9 (专业环保机构)9 (报刊杂志)9(社交互动平台)9 (家人朋友同学)9 (学校宣传教育)10.您认为以下哪些方法能提高绿色低碳意识? (加强低碳宣传力度)10 (加强低碳普及教育)10 (完善绿色低碳设施)10(建立健全相关的政策法规)11.......会影响我对低碳生活的看法—家人亲友的实践身边的人的响应周围的人身体力行舆论媒体积极倡导12.我认为低碳生活…—是明智的行为 对大家都有好处能够减缓气候变暖对解决环境问题是有益的13.—我有能力选择低碳生活我有条件实施低碳生活我有机会执行低碳生活我有足够知识进行低碳生活14.我打算以后…—减少使用一次性产品合理处理生活中的废弃物在日常生活中会进行垃圾分类尽可能劝说周围的人进行低碳生活15.日常生活中,我会......—对垃圾进行分类重复利用废旧物品避免使用一次性产品劝说周围的人进行低碳生活低碳行为积极性
1130秒122211120001101101545455445555443334430
282秒123211220101001000434534534454434543440
3230秒123211231001001111544334353233453334330
496秒122222221000000011555535133222252222220
6157秒121211220001111111555555555554555555430
798秒122211121001011010344344454454444343430
994秒121211131101010011434444444444444444430
1198秒222211231101011111555555554444444444440
12108秒122311220010011100444444444444444444440
13136秒121211230010010010334434443444344433240
共 未知 条数据,仅展示前 10 条
代码填空
import pandas as pd #读取一个Excel文件,并将读取到的数据存储在变量data中 data = #打印出数据集的前5行 print(data.head()) #处理数据集中的缺失值 initial_row_count = #处理前的数据行数 data = #删除缺失值所在行 final_row_count = #处理后的数据行数 print(f'处理后数据行数: {final_row_count}, 删除的行数: {initial_row_count - final_row_count}') #删除重复行 data = from sklearn.preprocessing import StandardScaler numerical_features = ['4.您的月生活费○≦1,000元 ○1,001-2,000元 ○2,001-3,000元 ○≧3,001元'] scaler = StandardScaler() data[numerical_features] = #选择特征 selected_features = [] X = # 创建目标变量 y = from sklearn.model_selection import train_test_split # 数据划分(测试集取20%) X_train, X_test, y_train, y_test = (, random_state=42) # 合并处理后得数据,并将其保存(保存中不用额外创建索引) cleaned_data = (, axis=1) ('2.1.2_cleaned_data.csv', )
提示: