テキストにエラーを導入する方法
エラー導入ツール(タイポジェネレーターとも呼ばれる)は、テキストに人間のタイプミスをシミュレートします。これは、スペルチェッカーや検索アルゴリズムの堅牢性をテストしたり、「自然な」非公式テキストを作成するのに役立ちます。
エラータイプ
- 文字の入れ替え: 隣接する文字の転置(例:"the"の代わりに"teh")。
- キー押し忘れ: 文字をスキップする(例:"writng")。
- 誤ったキー: QWERTY配列で近くのキーを押してしまうこと。
- 二重打ち: 誤って文字を繰り返すこと。
使用例
- あいまい検索の実装をテスト
- スペルチェックソフトウェアのQA
- OCR誤り訂正トレーニング用データの作成
- 急いで入力するユーザー入力をシミュレートします。