SQL数据清洗：利用SUBSTRING和CHARINDEX处理无效字符

日期：2025-01-03 作者：maq0s caijiyuan

核心提示：截取字符串我们在做BI可视化之前，通常需要已经清洗干净的数据才能进行可视化分析。随着电商的发展，有很多数据都

我们在做BI可视化之前，通常需要已经清洗干净的数据才能进行可视化分析。

随着电商的发展，有很多数据都是从网上渠道抓取过来的，这就导致原始数据有很多对于分析来说的无效数据，那么在SQL中这部分数据该如何进行处理呢？

函数介绍

SUBSTRING语法：

返回结果为：返回字符、binary、text 或 image 表达式的一部分。

CHARINDEX语法：

若省略第三参数，则默认从第一位开始查找。

返回结果：字符串开始出现的位置。

PATINDEX语法：

第一参数可以使用通配符，第二参数通常为被查找的字符串。

返回结果：字符串开始出现的位置。

注：

CHARINDEX函数与PATINDEX函数从结果上来看，二者的作用类似，不过前者是完全匹配，后者支持模糊查询。

使用实例

案例数据：

在白茶本机的数据库中存在名为“CaseData”的数据库。

存在名为“案例数据”的表。从上图中我们可以看出，数据量比较少，而且在[商品名称]这一列中存在很多的无用字符。

例子1：

提取手机的所有信息，并将[商品名称]中无用的字符串去掉。

代码1：

结果如下：

解释：

这段代码中，我们首先通过CHARINDEX函数定位到手机出现的字符串位置，再通过SUBSTRING函数进行字符串截取。

代码2：

结果如下：

例子2：

提取[商品名称]中所有商品，并将[商品名称]中无用的字符串去掉。

代码：

结果如下：

解释：

这段代码中，我们先判断的是“[”符号首次出现的位置，来定位所有商品名称的首字符位置，再通过判断“]”的位置来确认商品名称的末字符位置，二者相减即为需要截取的字符串长度。

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

更多>同类生活信息

文章列表

相关文章

最新动态

推荐图文

生活信息

点击排行