Informace o projektu
Podobnostní vyhledávání s konstantní škálovatelností
(SIM-SCALE)
- Kód projektu
- GPP202/10/P220
- Období řešení
- 1/2010 - 12/2012
- Investor / Programový rámec / typ projektu
-
Grantová agentura ČR
- Postdoktorské projekty
- Fakulta / Pracoviště MU
-
Fakulta informatiky
- RNDr. David Novák, Ph.D.
- Klíčová slova
- podobnostní vyhledávání; multimediální data; datové struktury; peer-to-peer sitě; škálovatelnost
Díky rozmachu digitálních záznamových zařízení produkuje lidstvo stále více elektronických dat. Tento nárůst se netýká pouze samotného objemu dat, ale také rozmanitosti datových typů. Protože nová data často vyžadují nové postupy zpracování a vyhledávání v nich, je věnováno nemalé úsilí oblasti tzv. podobnostního vyhledávání. Doposud ale nebyl navržen vyhledávací mechanismus, který by byl obecný, dostatečně efektivní a zejména škálovatelný - tedy použitelný pro velké objemy dat. Cílem projektu je nalezení univerzálních a efektivních datových struktur pro podobnostní vyhledávání, které by měly, ideálně, konstantní vyhledávací náklady vzhledem k rostoucímu objemu zpracovávaných dat. Výzkum bude vycházet z našich zkušeností v této oblasti a bude sledovat tyto dvě linie: 1) rekurzivní dělení metrického prostoru pomocí fixní množiny pivotů a 2) kombinace několika ortogonálních indexů. Navržené vyhledávací techniky budou implementovány, testovány na reálných datech a použity pro vytvoření několika vyhledávacích systémů, mj. na databázi mající stovky milionů digitálních obrázků.
Publikace
Počet publikací: 10
2012
-
Distributed M-Index
Rok: 2012
-
Generic Subsequence Matching Framework: Modularity, Flexibility, Efficiency
Database and Expert Systems Applications, rok: 2012
-
Generic Subsequence Matching Framework: Modularity, Flexibility, Efficiency
Rok: 2012, druh: Účelové publikace
-
Large-scale similarity data management with distributed Metric Index
Information Processing and Management, rok: 2012, ročník: 48, vydání: 5, DOI
-
Visual Image Search: Feature Signatures or/and Global Descriptors
Similarity Search and Applications, rok: 2012
2011
-
Employing Subsequence Matching in Audio Data Processing
Rok: 2011, druh: Prezentace v oblasti VaV (AV tvorba, WEB aplikace apod.)
-
Metric index: an efficient and scalable solution for precise and approximate similarity search
Information Systems, rok: 2011, ročník: 36, vydání: 4, DOI
-
Stabilizing the Recall in Similarity Search
Fourth International Conference on Similarity Search and Applications, SISAP 2011, rok: 2011
2010
-
Audio Similarity Retrieval Engine
Third International Conference on Similarity Search and Applications, rok: 2010
-
On Locality-sensitive Indexing in Generic Metric Spaces
3rd International Conference on Similarity Search and Applications, rok: 2010