|  
                            
                             Workshops auf der General Online Research 05 
                             
                              1.) Titel des Workshops: 
                              Nichtreaktive Datenerhebung im Internet und Data Mining Dr. Dietmar Janetzko
(Universität Freiburg)
 
                             
                              2.) voraussichtliche Dauer des Workshops: 
                              2 x 90 Minuten  
                             
                              3.) Preis (voll / ermäßigt): 
                              50,- Euro (78,- CHF)/ 25,- Euro (39,- CHF) 
                             
                              4.) Zielgruppe(n): 
                              Praktiker (Markt- und Meinungsforscher, Marketingfachleute), 
                              Akademiker (Psychologie, Wirtschafts-, Politik- 
                              und Informationswissenschaft, Soziologie, Pädagogik) 
                             
                            5.) Ist der Workshop nur auf ein exklusiv deutschsprachiges 
                              oder auch auf ein internationales Publikum ausgerichtet? 
                              Der Workshop richtet sich an ein deutschsprachiges 
                              sowie an ein internationales Publikum 
                             
                              6.) Workshop-Sprache: 
                             englisch 
                             
                              7.) Beschreibung der Inhalte des Workshops: 
                              Bei der nicht-reaktiven Datenerhebung werden Methoden 
                              und Techniken eingesetzt, mit denen Daten ohne Kenntnisnahme 
                              der untersuchten bzw. beobachteten Person ermittelt 
                              werden können. Nicht-reaktive Datenerhebung 
                              im Internet haftet daher die Aura von Geheimdiensten 
                              und finsteren Machenschaften weltweit agierender 
                              Konzerne an. Wie jede Form der Datenerhebung kann 
                              jedoch auch die nicht-reaktive Erhebung von Daten 
                              zumeist nur eine kleine Teilmenge derjenigen Informationen 
                              ermitteln, die prinzipiell von einer auskunftsbereiten 
                              und auskunftsfähigen interessierenden Person 
                              beziehbar wären. Allerdings können gerade 
                              nicht-reaktiv erhobene Daten unter Umständen 
                              trickreich mit anderen Datenquellen verknüpft 
                              werden und auf diese Weise durchaus wirtschaftlich 
                              bedeutsam oder auch datenschutzrechtlich bedenklich 
                              werden. Ein Beispiel ist die verdeckte Datenerhebung, 
                              mit der ermittelt wird, ob beim Spamming verschickte 
                              Adressen kalt oder warm sind. Während sich 
                              die öffentliche Aufmerksamkeit zumeist auf 
                              Cookies verengt hat, sind längst schon eine 
                              Reihe weiterer Techniken im Einsatz, die Cookies 
                              ersetzen oder ergänzen können. Dazu zählen 
                              unter anderem verdeckte Zeitmessung, Session-Ids/nicht 
                              persistente Cookies, Logfiles, Software Heimweh, 
                              Web Beacons/Web Bugs/Clear Gifs oder Spyware. Neben der Kombination unterschiedlicher Datenquellen spielt die Auswertung mit Verfahren des Data Mining eine zunehmend wichtigere Rolle, da sich darüber Informationen gewinnen lassen, die schwierig zu erheben sind. Datenkombination und Data Mining teilen somit das Ziel, den Informationswert der Daten zu steigern.   
                             
                              Entsprechend der Vielschichtigkeit des Themas der 
                              nicht-reaktiven Datenerhebung werden im Workshop 
                              folgende Schwerpunkte gesetzt. 
                            A) Methodik und Techniken der nicht-reaktiven Datenerhebung 
                              B) Technische Zusammenführung von Massendaten 
                              C) Privacy und Datenschutz bei nicht-reaktiver Datenerhebung 
                              D) Data Mining - Grundlagen und Anwendungsbeispiele 
                            Die Inhalte des Workshops werden teils über 
                              Vorträge, teils aber auch über Software-Demonstrationen 
                              und Übungen vermittelt. Dazu empfiehlt sich 
                              die Mitnahme eines Notebooks. Im Workshop werden 
                              wir neben einem Booklet eine CD-ROM austeilen, auf 
                              der Beispielanwendungen für nicht-reaktive 
                              Datenerhebungen abgelegt sind. Dazu setzen wir eine 
                              Technik ein, über die eine auf dem Apache-Server 
                              aufsetzende Client-Server Architektur direkt ausführbar 
                              vorinstalliert wird (Kennke & Janetzko, 2002). 
                             
                              8.) Lernziele: 
                              Die Teilnehmer sollen neben den obligaten methodischen 
                              Grundlagen, Techniken kennen und beherrschen lernen, 
                              mit denen Daten nicht-reaktiv erhoben werden können. 
                              Daneben werden Grundlagen des Data Mining vermittelt. 
                             
                              9.) notwendige Vorkenntnisse der Teilnehmer: 
                              Kenntnisse in HTML und Inferenzstatistik werden vorausgesetzt. Von Vorteil 
                              ist es auch, wenn die Teilnehmer und Teilnehmerinnen 
                              Grundlagen von JavaScript beherrschen. 
                             
                              10.) Literatur, die als bekannt vorausgesetzt 
                              wird: 
                             
                              11.) sinnvolle Ergänzungsliteratur: 
                              Janetzko, D. (1999a). Statistische Anwendungen im 
                              Internet. München: Addison-Wesley.  
                              Janetzko, D. (1999b). Surfer im Visier. c't, 20, 
                              86-92 
                              Kennke, R. & Janetzko, D. (2002) WWW auf der 
                              Scheibe. c't, 12. 
                              Lohse, C. & Janetzko, D. (2001). Technische 
                              und juristische Regulationsmodelle des Datenschutzes. 
                              Computer und Recht. Heft 1, 53-59. 
                              Janetzko, D. (2002). Das experimentalpsychologische 
                              Praktikum im Labor und WWW. Göttingen: Hogrefe. 
                             
                              12.) Kurz-Beschreibung des Ausrichters: 
                          Dr. D. Janetzko und Roman Kennke bauen zur Zeit ein Unternehmen auf, das Software zur Visualisierung und Präsentation von Informationen und Datenanalyse entwickelt (http://www.ontographics.com).  
                         
                             
                               
                             |