AI活用の再設計 14|公式連携がなくても諦めない。ソフトのCSVをAIと解読して中間層を作る

未分類

自分が使っている税務申告ソフトは、画面に一項目ずつ手で打ち込む入力を前提にしている。 前年の数字はソフトの中に残っているのに、今年の資料からの転記はやはり手作業でなぞり直すことになる。 APIも、外部からインポートできる窓口も用意されていない。 毎年、同じ作業を同じ手で繰り返していた。

この記事は、税理士向けの生成AI活用をまとめた書籍の事例をお題に借りて、自分の実運用を書いてきたシリーズの続きである。 ここからの数本は、お題を書籍ではなく2025年分の確定申告の現場から取る。

画面に一項目ずつ手で入力し前年分も手で転記する従来のやり方と、CSV帳票61種類をAIと解読して中間台帳に集約し複数ソースをインポートで流し込む自分のやり方の対比図
図1: 画面へ手で転記する従来と、CSVを解読して台帳に集約する自分の対比

CSV帳票61種類をAIと解読し、台帳という中間層に固定する

入力の窓口はなくても、出力の窓口ならソフトにある。 使っているソフトは、入力済みのデータをCSV帳票として書き出せる。 この帳票は61種類あり、様式も中身もばらばらだった。

61種類すべてを、AIと1枚ずつ突き合わせて調べた。 1つの帳票の中に項目名と値が並ぶキー・バリュー型なのか、行と列で構成されるテーブル型なのか、まず形式を判定する。 そのうえで、帳票ごとのフィールド構成と、複数の帳票が同じ数字を持つときにどちらを優先するかを、ドキュメントに書き出した。

調べた結果は、年度を横に並べたスプレッドシートの台帳として設計した。 チェックシート、前年度のエクスポートCSV、明細のXMLという複数のソースから、この台帳にデータを集める。 台帳からソフトの取り込み用CSVテンプレートへ書き込み、データの入っていない帳票は自動で除外してから、ソフトへインポートする。

文字コードはCP932、改行はCRLFという古い形式にも合わせて実装した。 途中でHTML形式のCSVビューアも作ったが、台帳の運用が固まったあとは使わなくなった。 作って使わなくなった経緯も、そのままドキュメントに残している。

解読の手間より、台帳を挟んだことの方が効いた

61種類の帳票を1件ずつ人が読み解くのは、割に合わない作業だ。 同じ作業は、AIにとっては数時間で終わる仕事になる。 この差があったから、解読を実際の選択肢として検討できた。

もっとも、値打ちがあるのは解読そのものより、解読した結果を台帳という一段の中間層に固定したことにある。

チェックシートと前年CSVと明細XMLの3つのソースを台帳という中間データ層に集約し、CSVテンプレートへ書き込んでデータのない帳票を自動で除外したうえで、人が目視確認してから税務ソフトへインポートする構造図
図2: 複数ソースを台帳に集約し、テンプレートへ書き込んでから人の目視でソフトへ渡す構造

チェックシートの様式が変わっても、前年のCSVの形が変わっても、ソフトそのものが入れ替わっても、崩れるのは台帳の手前か向こう側の1本の接続だけで、台帳の構造自体は変えなくてよい。 ソースと出口の間に台帳を1枚挟むことで、変化を受け止める場所を1箇所に決めたことになる。

最後のインポートは、目視確認込みの手動にしてある。 自動化しているのは形式の解読とデータの集約までで、ソフトへ渡す最後の一手は人に残した。

会計事務所の転記も、CSVの窓口を探すところから始まる

申告ソフト、給与ソフト、会計ソフトの間の転記は、税理士業務のあちこちに残っている。 ソフト同士がAPIでつながっていなくても、たいていどこかにCSVのエクスポートかインポートの窓口がある。 まず探すべきはその窓口で、次にその窓口の形式をAIに読み解かせることだ。

読み解いた結果をチャットの中に留めず、台帳のようなファイルとして事務所に残しておけば、ソフトのバージョンが変わっても、担当者が変わっても、同じ台帳を経由する工程はそのまま動く。 作法・工程をファイルにするという話は、ここでも同じである。