存储数据的文本文件中常用空格、Tab、逗号或分号等作为分隔符。一些常用的数据分析工具可能仅接受这些分隔符中的一种,这时便需要将其他分隔符的数据转换为相应工具接受的数据格式。类似的数据准备工作也是实际数据分析工作中相当耗精力的部分。
下面是针对Tab转空格问题的两个方便的解决方案。

  • 方法1. sed是常用的方式,可以灵活指定需要替换的内容和目标内容。
    sed -i “s/\t/ /g” filename
  • 方法2. expand提供了一个方便的替换Tab为空格的工具。
    expand -t 1 filename

Usage: expand [OPTION]… [FILE]…
Convert tabs in each FILE to spaces, writing to standard output.
With no FILE, or when FILE is -, read standard input.
Mandatory arguments to long options are mandatory for short options too.
-i, –initial do not convert tabs after non blanks
-t, –tabs=NUMBER have tabs NUMBER characters apart, not 8
-t, –tabs=LIST use comma separated list of explicit tab positions
–help display this help and exit
–version output version information and exit