「識別形質まとめ」は、「論文3行まとめ」で入力した識別形質データをまとめたデータセットです。 以前オープンデータのデータベースに投稿した「識別形質LOD」の内容を一から作り直したものですが、 LOD化するかどうかは今のところ未定です。 最終更新日:2021/2/27 データ数:239,033(R3-08184まで反映) このページは、データの説明や解析例などを追加して徐々に充実させていく予定です。 ※比較文ごとに「形状」「サイズ」など、いくつかのカテゴリに分類しているので、集計に便利です。 分類には勾配ブースティング (catboost) の手法を活用しています (2020/4/18 word2vec+CNNから変更)。 人の目でチェックも行っていますが、誤りが含まれている場合があるのでご注意ください。