「識別形質まとめ」は、「論文3行まとめ」で入力した識別形質データをまとめたデータセットです。
以前オープンデータのデータベースに投稿した「識別形質LOD」の内容を一から作り直したものですが、
LOD化するかどうかは今のところ未定です。

最終更新日:2020/6/28
データ数:217,868(R3-07449まで反映)

このページは、データの説明や解析例などを追加して徐々に充実させていく予定です。

 

※比較文ごとに「形状」「サイズ」など、いくつかのカテゴリに分類しているので、集計に便利です。
分類には勾配ブースティング (catboost) の手法を活用しています
(2020/4/18 word2vec+CNNから変更)。
人の目でチェックも行っていますが、誤りが含まれている場合があるのでご注意ください。