・複数視点からのリアル画像を使ってメッシュを抽出することはできる(ただし、メッシュを抽出した時に結構ノイズが入る)
・今後の方針
→動画データからsegment anythingを使って自動マスク生成
→動画の1フレーム目で指定したオブジェクトの3Dモデルを生成
上の内容は1、2週間ぐらいでできるので、とりあえず終わらせます。
これぐらいの内容で卒業できることを保証してもらえれば、精度面で最先端の結果を出す方向で研究したいです。
あと、時間があれば微分可能レンダリングの勉強をしようと思ってます。