Publication details

Research Report

Does It Make Sense to Develop New Feature Selection Methods?

Somol Petr, Novovičová Jana

: ÚTIA AV ČR, (Praha 2007)

: Research Report 2193

: CEZ:AV0Z10750506

: 2C06019, GA MŠk, 1M0572, GA MŠk, 507752, EC, IAA2075302, GA AV ČR

: feature selection, subset search, search methods, performance estimation, classification accuracy

(eng): One of hot topics discussed recently in relation to pattern recognition techniques is the question of actual performance of modern feature selection methods. Feature selection has been a highly active area of research in recent years due to its potential to improve both the performance and economy of automatic decision systems in various applicational fields, with medical diagnosis being among the most prominent. Feature selection may also improve the performance of classifiers learned from limited data, or contribute to model interpretability. The number of available methods and methodologies has grown rapidly while promising important improvements. Yet recently many authors put this development in question, claiming that simpler older tools show to be actually better than complex modern ones -- which, despite promises, are claimed to actually fail in real-world applications.

(cze): Jedno z aktuálních témat diskutovaných v současné době ve vztahu k oboru rozpoznávání je otázka skutečné účinnosti moderních metod výběru příznaků. Výběr příznaků je stále zkoumaná oblast neboť může zlepšit jak účinnost tak i hospodárnost automatických rozhodovacích systémů v mnoha aplikačních oblastech, z nichž mezi nejdůležitější patří lékařská diagnostika. Výběr příznaků může také zlepšit účinnost klasifikátorů, navržených na základě omezeného množství dat, nebo přispět k interpretaci modelů. Zejména poslední dobou bylo vyvinuto mnoho metod a metodologií slibujících významné zlepšení. Nicméně objevila se také řada kritických příspěvků prohlašujících, že jednoduché staré nástroje jsou ve skutečnosti lepší než složité moderní metody, které, navzdory slibům, selhávají v reálných aplikacích. Ve zprávě zkoumáme toto tvrzení, ukazujeme několik ilustrativních příkladů, vyvozujeme závěry a doporučení týkající se očekávané účinnosti metod výběru příznaků.

: BB