抄録
Offer Organization: Japan Society for the Promotion of Science, System Name: Grants-in-Aid for Scientific Research, Category: Grant-in-Aid for Scientific Research (B), Fund Type: -, Overall Grant Amount: - (direct: 5100000, indirect: 1530000)
廃棄選別の作業には簿冊のタイトルのリストから選び出す「一次選別」と、実際に現物を手に取りながら、1日50冊ほど丁寧に中身を確認する「二次選別」がある。それぞれ「一次選別」「二次選別」を簿冊のタイトルやキーワードから効率よく選び出す方法はないのか、また「一次選別」と「二次選別」を通して、どのようなタイトルの簿冊が選別されているのかを跡付け、効率よく選別するには何が大切なのだろうか明らかにする。これまでの選別作業のデータの蓄積を次の選別の参考にするには、どうすればよいのか、今後の選別作業に利用できる点を明らかにすることである。
機械学習の「教師ありモデル」として、県の公文書の選別をすることができるのかどうか、検証することである。様々な、広範なタイトルから、ある程度絞り込んだうえで、分析しないと明確な基準が得られないという見解・見通しが現時点で出された。この弱点を補うために、絞り込みも(グループ分け)、大切になってくる。
我々の3月の研究会では「簿冊タイトル」からだけでは、難しいという見通しが提示された。「キーワード」、「あいまい検索」、「保存年限」、「性質区分」、「所属」などの組み合わせでの絞り込みをどのようにするのか、という点も加味しながら、簿冊単位で効率よい評価選別ができるのかどうか、という点が課題である。
統計データに関しては、国と県の線引きも、福祉関係と農林水産業の統計データで、国にどこまで任せられるのか、県でどこまでデータを継続して保有しなければならないのか、具体的に追求した。農林水産省のホームページからどの程度熊本県に関するデータが拾えるのか調べた。農林水産省がWEB上で公開している情報で、熊本県関係の情報がどの程度入手できるのか。また、それを踏まえ、熊本県でも残す必要があるのはどのような統計(国が県に委託した統計)なのかを検討した。県と市町村の線引きも大切である。