Screen2.0

 
 
 

archive // 2005.04.06 08:48:50 [her]

Metafy präsentiert neue Version seines Web Mining Tools "Anthracite"

Das Web Mining Desktop "Anthracite" (Mac OS X) von dem 2003 gegründeten US-amerikanischen Softwareentwickler Metafy liegt jetzt in Version 1.1 vor. Zu den Neuerungen zählt die direkte Unterstützung des "Google APIs" und eine deutlich beschleunigte Ausführung der visuell erstellten Mining Aufgaben.

"Anthracite" ist ein Programm, das die visuelle Erstellung von Informationsflüssen und die Exktraktion von Information aus Web-Seiten oder Text-Dateien mittels regulären Ausdrücken oder weiteren Bearbeitungsschritten erlaubt – und das völlig ohne Scripting. Dazu werden Informationsquellen und Bearbeitungsschritte auf das Desktop plaziert, durch Doppelklick konfiguriert und mittels Pfeilen verbunden (Command-Drag-and-Drop). Für das Rapid Prototyping und für Routineaufgaben bei der Zusammenstellung von Informationen ist dieses Mac-OS-X-Tool ein wertvoller und sehr effizienter Begleiter beim "visual spidering and scraping".

Neu in Version 1.1 ist ein AppleScript-fähiges "Google API" (Application Programming Interface), das es erlaubt in einem einzigen Schritt Informationen aus Google-Suchergebnissen zu extrahieren (einen validen "Google Key" vorausgesetzt). Damit kann zum Beispiel die Suchengine-Optimierung effektiv unterstützt werden.

"Anthracite" kostet 99 US$; eine kostenlose Testversion (2 Wochen unbeschränkt) gibt es ebenfalls auf der Web-Site des Herstellers (www.metafy.com). Mac OS X 10.2.8 oder neuer ist erforderlich zum erfolgreichen "Web Mining" getreu dem Motto "Access Information, Distribute Knowledge".

Jetzt fehlt nur noch ein kleiner Compiler, der die Erstellung von Standalone-Programmen für Mac OS X und Windows ermöglicht und die Benutzung der Ergebnisse als Datenquellen für weitere Verarbeitungsschritte (ohne den Umweg über externe Scripte) zuläßt. Ansonsten ist dieses Tool sehr zu empfehlen für eine automatisierte Informationsbeschaffung ohne Programmierkenntnisse.

 

Werbung