Ansatzの備忘録

勉強したことあるいはふと思い立ったこと

シェルワンライナー160本ノック問題78

問題78 常用漢字でない漢字の検出

問題のファイルは

https://github.com/shellgei/shellgei160

からダウンロードできる。

常用漢字表に含まれていない漢字を抜き出す問題だった。ちょっと勘違いをしていたせいでおかしなワンライナーを書いてしまった。

解答例は

$ grep -oE '[一-龠]' sample_novel.txt | grep -vf jouyou_kanji.txt

となる。一つ目の grep でサンプルテキストに含まれている漢字を抜き出し、次の grep に検索対象として渡して処理を行っている。