Discuz! Board

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 208|回复: 0

们可以告诉为我们处理它们而不是将

[复制链接]

1

主题

1

帖子

5

积分

新手上路

积分
5
发表于 2023-11-13 11:41:16 | 显示全部楼层 |阅读模式
型。这并不是说您需要拥有完整的数据集。为您提供了一种处理空值和缺失值的便捷方法如下一个示例所示。示例处理值并将转换为数组。让我们返回到带有汽车模型数据的原始。然而这一次列中缺少一对值包含汽车模型数据和列中的值打印到终端我们应该有第一行和第三行的平均速度但我们有不是数字标记。换句话说这些是空值。我这些值保存到我们的数组中在这里我们使用参数告诉我们希望将任何空值设置为基值。平均速度值现在在我们的数组中进行相应更新数组其中第一个和第三个嵌套数组中的最后一个值是并打印到终端保留空值还是替换它们更好取决于数据分析的参数和组织中的数据治理策略。由于此数据涉及单个汽车属性因此最好保留空值以便其他数据工程师知道平均速度值集的数据质量不可靠并且他们不会得出错误的结论。

相反大型数据集可能更能容忍一些缺失值或占位符值因为它们不太可能影响涉及所有行的计算。另请注意如果多列中有空值例如和则参数将普遍应用因此在转换完整时它并不总是最好使用。否则在本例中我们最终可能会得到作为汽车制造商的名称。这些注意事项意味着在将单个列转换为数组而不是整个时最好使 比利时电报号码数据 用参数。接下来我们将回顾该语法。示例将各个列转换为数组。




数组的一个自然用例是将单列也称为的值存储在中。我们可以通过使用索引运算符和来实现这一点在这里我们使用索引运算符在中搜索索引标签。一旦找到引用的列就会将列数据转换为数组在打印到终端的数组中捕获的列中的值返回到上一个示例我们现在可以部署参数来替换更有限范围内的缺失值和空值现在我们不再冒着将重置值添加到没有意义的列中的风险。通过将转换为数组来优化分析。是一个用于处理关系数据的强大库但与任何代码包一样它并不是在每个用例中都是完美的。是为支持大规模统计分析而构建的第二个库。通过将转换为数组您可以享受这两个框架的优势同时优化数据存储和分析。主题什。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Discuz! X

GMT+8, 2024-9-22 17:41 , Processed in 0.031250 second(s), 18 queries .

Powered by Discuz! X3.5

Copyright © 2001-2022 Tencent Cloud.

快速回复 返回顶部 返回列表