Project information
Podobnostní vyhledávání s konstantní škálovatelností
(SIM-SCALE)
- Project Identification
- GPP202/10/P220
- Project Period
- 1/2010 - 12/2012
- Investor / Pogramme / Project type
-
Czech Science Foundation
- Postdoctoral projects
- MU Faculty or unit
-
Faculty of Informatics
- RNDr. David Novák, Ph.D.
- Keywords
- similarity search; multimedia; data structures; peer-to-peer
Díky rozmachu digitálních záznamových zařízení produkuje lidstvo stále více elektronických dat. Tento nárůst se netýká pouze samotného objemu dat, ale také rozmanitosti datových typů. Protože nová data často vyžadují nové postupy zpracování a vyhledávání v nich, je věnováno nemalé úsilí oblasti tzv. podobnostního vyhledávání. Doposud ale nebyl navržen vyhledávací mechanismus, který by byl obecný, dostatečně efektivní a zejména škálovatelný - tedy použitelný pro velké objemy dat. Cílem projektu je nalezení univerzálních a efektivních datových struktur pro podobnostní vyhledávání, které by měly, ideálně, konstantní vyhledávací náklady vzhledem k rostoucímu objemu zpracovávaných dat. Výzkum bude vycházet z našich zkušeností v této oblasti a bude sledovat tyto dvě linie: 1) rekurzivní dělení metrického prostoru pomocí fixní množiny pivotů a 2) kombinace několika ortogonálních indexů. Navržené vyhledávací techniky budou implementovány, testovány na reálných datech a použity pro vytvoření několika vyhledávacích systémů, mj. na databázi mající stovky milionů digitálních obrázků.
Publications
Total number of publications: 10
2012
-
Distributed M-Index
Year: 2012
-
Generic Subsequence Matching Framework: Modularity, Flexibility, Efficiency
Database and Expert Systems Applications, year: 2012
-
Generic Subsequence Matching Framework: Modularity, Flexibility, Efficiency
Year: 2012, type:
-
Large-scale similarity data management with distributed Metric Index
Information Processing and Management, year: 2012, volume: 48, edition: 5, DOI
-
Visual Image Search: Feature Signatures or/and Global Descriptors
Similarity Search and Applications, year: 2012
2011
-
Employing Subsequence Matching in Audio Data Processing
Year: 2011, type: R&D Presentation
-
Metric index: an efficient and scalable solution for precise and approximate similarity search
Information Systems, year: 2011, volume: 36, edition: 4, DOI
-
Stabilizing the Recall in Similarity Search
Fourth International Conference on Similarity Search and Applications, SISAP 2011, year: 2011
2010
-
Audio Similarity Retrieval Engine
Third International Conference on Similarity Search and Applications, year: 2010
-
On Locality-sensitive Indexing in Generic Metric Spaces
3rd International Conference on Similarity Search and Applications, year: 2010