はじめに
Linuxを使っていると「行数を知りたい」「文字数を数えたい」なんて場面はよくあります。
そんなときに便利なのが wc
(word count)コマンド。
シンプルですが、-l
と -w
、それに -c
と -m
の違いで混乱しやすい人も多いはず。
今回は オプションの意味と覚え方 に絞って整理します。
基本の使い方
テキストファイルを対象に wc
を実行すると、行数・単語数・バイト数がまとめて表示されます。
これは左から順に
-
行数
-
単語数
-
バイト数
を表しています。
覚え方まとめ
オプション | 意味 | 覚え方 |
---|---|---|
-l |
行数 (line) | Line の L |
-w |
単語数 (word) | Word の W |
-c |
バイト数 (byte count) | Count の C |
-m |
文字数 (character) | Multi-byte character の M と覚える |
M が character の理由
「character なら -c
じゃないの?」と思った人も多いはず。
実は -c
はすでに 「バイト数 (count)」 のために使われているんです。
そのため文字数 (character) を表すには別の記号が必要になり、
マルチバイト文字 (multi-byte character) を正しく数えるオプションとして -m
が割り当てられています。
👉 つまりこう覚えましょう:
-
C = Count(サイズ的なバイト数)
-
M = Multi-byte(マルチバイトも考慮した文字数)
これで混乱が減ります。
注意点
-
ファイルを指定しない場合、標準入力から受け取れる。
-
日本語ファイルなどマルチバイト文字が含まれると、
-c
(バイト数)と-m
(文字数)の結果が異なることがある。 -
試験でも
-c
と-m
の違い が狙われやすい。
まとめ
-
wc
コマンドは「行数・単語数・バイト数・文字数」を数えるための基本コマンド。 -
覚え方は L=line, W=word, C=count, M=multi-byte。
-
特に
-c
と-m
の違いを押さえておくと、試験でも実務でも混乱しにくい。
コメント