Publication details

Conference Paper (international conference)

Information analysis of census data by using statistical models

Grim Jiří, Hora J., Boček Pavel, Somol Petr, Pudil P.

: Proceedings of the International Conference on Statistics - Investment in the Future, p. 1-7 , Eds: Krovák J.

: Statistics - Investment in the Future, (Prague, CZ, 06.09.2004-07.09.2004)

: CEZ:AV0Z1075907

: 507752, , GA402/02/1271, GA ČR

: statistical databases, information analysis, statistical models

(eng): We describe a new method of information oriented data analysis (data mining) based on a quick evaluation of a virtual list of several hundreds of thousands of sub-populations. The sub-populations can be ordered according to different criteria like conditional probability of a value, conditional entropy of a variable or mutual informativity of a pair of variables. In this way we can identify causal relations between values and variables in a qualitatively new way.

(cze): V práci je popsána kvalitativně nová možnost informační analýzy statistických databází (datamining) s využitím statistického modelu. Metoda je založena na rychlém vyhodnocení virtuálního seznamu několika set tisíc subpopulací a jejich uspořádání z hlediska zvoleného kriteria, jako je např. podmíněná pravděpodobnost nějaké vlastnosti, podmíněná entropie nebo Shannonovská informace dvojice proměnných. Uvedeným způsobem lze identifikovat např. kauzální vztahy nominálních proměnných

: 05A, 05W, 05R

: AO