Przeglądając różne zasoby natknąłem sie na bazę MNIST. Są tam ręcznie pisane litery, ale też zdjęcia storczyków.
Czy wspólnymi silami można było by zrobić taką bazę jakiejś rośliny?
Powiedzmy coś co jest popularne. Mniszek lekarski, może jakieś proste rośliny?
Trzeba by było tego conajmniej 70 tysięcy zdjęć. Najlepiej robione z różną rozdzielczoscią, różnymi aparatami różne oświetlenie itp.
Taka baza w jednym formacie była by bardzo pomocna przy rozpoznawaniu roslin.
Jak dla mnie to mnożenie bytów ponad potrzebę.
Moim zdaniem do prawidłowego rozpoznania i oznaczenia gatunku rośliny wystarczy dobrze poznać, uchwycić i wyeksponować (dobrym zdjęciem) jego cechy charakterystyczne, zwłaszcza te, które różnią go od podobnego gatunku. Dobrym przykładem jest choćby nasz Atlas (znajdziesz tam blisko 50 tys. fotografii), gdzie w większości przypadków możemy zobaczyć te cechy, o nich przeczytać (klucze) i dokonać prawidłowego oznaczenia swojego okazu. Jest też nasze dyskusyjne bio-forum, gdzie przecież możemy swoje wątpliwości zgłosić, wspólnie przedyskutować i ostatecznie wykorzystać do rozpoznania rośliny. W sieci też aż roi się od dobrych zdjęć i opisów roślinek. Poza tym, to wielka frajda samemu spróbować oznaczyć napotkaną roślinę w terenie czy tę zebraną do zielnika.
Ale jak nauczyć komputer jakie to cechy?
np. tu http://archive.ics.uci.edu/ml/index.php jest zbiór różnych danych. Między innymi baza Iris.
Pozwoli to rozróżnić obiekty na zdjęciu. Wprawdzie tu tych zdjęć (storczyków jak mniemam) jest lekko więcej. Ale zacząć można od mniejszej ilości.
To raczej takie wyzwanie. Dajemy zdjęcia i jaki naukowiec będzie w stanie lepiej oznaczyć niż inny naukowiec. Dokładnośc rozpoznawania liter odręcznych jest na poziomie 99,98 ale muszą być pisane oddzielnie.
(wypowiedź edytowana przez marcepan 05.marca.2018)
@Roman Ryś
Przepraszam, ale chyba jednak ta baza o ktorej piszesz nie ma tyl grafik.
Tu chodzi o 50 tyś zdjęć jednego gatunku
Przypomnij sobie takie przysłowie - Mądrej głowie dość dwie słowie - którym podkreślamy, że inteligentnej osobie wystarczą dwa słowa, by zrozumiała, co mamy na myśli. To stare powiedzenie, będące polską wersją łacińskiej sentencji: Dictum sapienti sat est ...
Po to, aby nie mnożyć bytów (baz zdjęć) ponad potrzebę.
Piotrze, pytałem kolegę z pierwszego wpisu (z Tobą pełna zgoda :-)
@Roman Ryś Widzę, że zamiast odpowiedziec na pytanie albo przyznać się, że jednak taka baza nie istnieje wolisz pokazywac jak ty jestes w stanie rozróżnić na obrazku dwie roslinki.
Problemem może być jednak zmuszenia komputera do zobaczenia tej rosliny, albo wyłuskania jej z pośród innych obiektów.
@Piotr G. Przepraszam, ale nie ma czego mnożyć. Na razie mamy jedna baze danych i to niepolską. Uwaga jest zatem bez sensu.
Chodzi o badania nad rozpoznawaniem obrazów przez komputer. Takie bazy nie jest łatwo zrobić, ale moim zdaniem można by było zacząć.
Na razie komputer nie wie co to gałąź czy liść. Dopiero mając jakieś dane może się uda zrobić taki algorytm. Polacy mogli by dodać cząstkę wiedzy do ogólnoświatowej nauki. To jest propozycja.