AI活用の再設計 14|公式連携がなくても諦めない。ソフトのCSVをAIと解読して中間層を作る
自分が使っている税務申告ソフトは、画面に一項目ずつ手で打ち込む入力を前提にしている。 前年の数字はソフトの中に残っているのに、今年の資料からの転記はやはり手作業でなぞり直すことになる。 APIも、外部からインポートできる窓口も用意されていない。 毎年、同じ作業を同じ手で繰り返していた。
この記事は、税理士向けの生成AI活用をまとめた書籍の事例をお題に借りて、自分の実運用を書いてきたシリーズの続きである。 ここからの数本は、お題を書籍ではなく2025年分の確定申告の現場から取る。
CSV帳票61種類をAIと解読し、台帳という中間層に固定する
入力の窓口はなくても、出力の窓口ならソフトにある。 使っているソフトは、入力済みのデータをCSV帳票として書き出せる。 この帳票は61種類あり、様式も中身もばらばらだった。
61種類すべてを、AIと1枚ずつ突き合わせて調べた。 1つの帳票の中に項目名と値が並ぶキー・バリュー型なのか、行と列で構成されるテーブル型なのか、まず形式を判定する。 そのうえで、帳票ごとのフィールド構成と、複数の帳票が同じ数字を持つときにどちらを優先するかを、ドキュメントに書き出した。
調べた結果は、年度を横に並べたスプレッドシートの台帳として設計した。 チェックシート、前年度のエクスポートCSV、明細のXMLという複数のソースから、この台帳にデータを集める。 台帳からソフトの取り込み用CSVテンプレートへ書き込み、データの入っていない帳票は自動で除外してから、ソフトへインポートする。
文字コードはCP932、改行はCRLFという古い形式にも合わせて実装した。 途中でHTML形式のCSVビューアも作ったが、台帳の運用が固まったあとは使わなくなった。 作って使わなくなった経緯も、そのままドキュメントに残している。
解読の手間より、台帳を挟んだことの方が効いた
61種類の帳票を1件ずつ人が読み解くのは、割に合わない作業だ。 同じ作業は、AIにとっては数時間で終わる仕事になる。 この差があったから、解読を実際の選択肢として検討できた。
もっとも、値打ちがあるのは解読そのものより、解読した結果を台帳という一段の中間層に固定したことにある。
チェックシートの様式が変わっても、前年のCSVの形が変わっても、ソフトそのものが入れ替わっても、崩れるのは台帳の手前か向こう側の1本の接続だけで、台帳の構造自体は変えなくてよい。 ソースと出口の間に台帳を1枚挟むことで、変化を受け止める場所を1箇所に決めたことになる。
最後のインポートは、目視確認込みの手動にしてある。 自動化しているのは形式の解読とデータの集約までで、ソフトへ渡す最後の一手は人に残した。
会計事務所の転記も、CSVの窓口を探すところから始まる
申告ソフト、給与ソフト、会計ソフトの間の転記は、税理士業務のあちこちに残っている。 ソフト同士がAPIでつながっていなくても、たいていどこかにCSVのエクスポートかインポートの窓口がある。 まず探すべきはその窓口で、次にその窓口の形式をAIに読み解かせることだ。
読み解いた結果をチャットの中に留めず、台帳のようなファイルとして事務所に残しておけば、ソフトのバージョンが変わっても、担当者が変わっても、同じ台帳を経由する工程はそのまま動く。 作法・工程をファイルにするという話は、ここでも同じである。