Tensorflow Lite Posenet atau Pose estimation adalah tugas menggunakan model ML untuk menganggarkan pose seseorang dari gambar atau video dengan menganggarkan lokasi spasial sendi badan utama (titik kekunci).
Pose estimation merujuk kepada teknik penglihatan komputer yang mengesan gambar manusia dalam gambar dan video, sehingga seseorang dapat menentukan, misalnya, di mana siku seseorang muncul dalam gambar. Penting untuk menyedari hakikat bahawa pose anggaran hanya menganggarkan di mana sendi badan utama berada dan tidak mengenali siapa yang ada dalam gambar atau video.
Model PoseNet mengambil gambar kamera yang diproses sebagai input dan output maklumat mengenai titik kekunci. Titik kekunci yang dikesan diindeks oleh ID bahagian, dengan skor keyakinan antara 0.0 dan 1.0. Skor keyakinan menunjukkan kebarangkalian bahawa papan kekunci wujud pada kedudukan tersebut.
Penanda aras prestasi
Prestasi berbeza-beza berdasarkan peranti anda dan kemajuan output (peta panas dan vektor mengimbangi). Model PoseNet adalah ukuran gambar yang tidak berubah-ubah, yang bermaksud ia dapat meramalkan kedudukan pose dalam skala yang sama dengan gambar asal tanpa mengira sama ada gambar itu dikecilkan. Ini bermaksud bahawa anda mengkonfigurasi model agar mempunyai ketepatan yang lebih tinggi dengan mengorbankan prestasi.
Langkah output menentukan berapa banyak output yang dikecilkan berbanding dengan ukuran gambar input. Ini mempengaruhi ukuran lapisan dan output model.
Semakin tinggi kemajuan output, semakin kecil resolusi lapisan dalam rangkaian dan output, dan juga ketepatannya. Dalam pelaksanaan ini, langkah output dapat memiliki nilai 8, 16, atau 32. Dengan kata lain, langkah output 32 akan menghasilkan prestasi terpantas tetapi ketepatan terendah, sementara 8 akan menghasilkan ketepatan tertinggi tetapi prestasi paling lambat. Nilai permulaan yang disyorkan ialah 16.