Ambience Website Content Classifier (CAS)

Passus Ambience CAS wchodzi w skład systemu Ambience będącego rozwiązaniem klasy  ETL (ang. extract, transform, load) czasu rzeczywistego. Dokonuje ekstrakcji danych z ruchu sieciowego i strumieni informacji oraz umożliwia ich analizę, dowolne przekształcenie oraz uzupełnienie o dane pochodzące z zewnętrznych źródeł. Uzyskane wyniki mogą być przekazane w formie zdarzeń do innego sytemu (w tym także systemu źródłowego), a także wyzwolić dowolnie zdefiniowaną akcję.
 
Ambience Content Analysis System prowadzi analizę zawartości stron internetowych w czasie rzeczywistym (opóźnienia nie przekraczają 100ms). Moduł, wykorzystując protokoł ICAP, można zintegrować z serwerem proxy, a tym samym przekazywać z niego dane, które mają podlegać ocenie.

Moduł Ambience Website Content Classifier zintegrowano z funkcjonalnością filtrowania adresów URL serwera Passus Proxy.  Treści strony internetowej przekazywane są za pomocą protokołu ICAP. Moduł analizuje zawartość strony, a następnie zwraca tym samym kanałem informacje o kategorii tematycznej danej strony oraz kontekście, w jakim występuje dany temat (np. treści mogą być dostępne dla wszystkich lub tylko określonej grupy np. dla dorosłych).

Do analizy zawartości strony przekazywane są jedynie elementy wybrane za pomocą reguł proxy. Selekcja odbywa się zarówno pod kątem typów obiektów, jak również typów oraz kategorii stron zgodnie z klasyfikacją dokonaną na podstawie adresu URL przez serwer proxy.

 
Analiza treści

System jest otwarty co oznacza, że użytkownik może dostosować mechanizm klasyfikacji na wiele sposobów:
  • Poprzez definiowanie białej i czarnej listy.
  • Poprzez sterowanie progiem odcięcia (czułością) modelu analitycznego
  • Poprzez definiowanie nowych kategorii tematycznych lub modeli odpowiadających za kontekst treści.

Rozpoznawane kategorie stron

System jest wyposażony w gotowy do pracy silnik, który kategoryzuje strony w języku polskim i angielskim w kategoriach tematycznych przedstawionych w tabeli poniżej.

- ABORTION
- ADULT/MATURE
- ADVERTISING
- ALCOHOL
- ALTERNATIVE LIFESTYLE
- ANOREXIA
- ART. CULTURE
- AUTOMOTIVE
- BIKINI
- BUSINESS
- CAREERS
- CHATS
- CHILD PORNOGRAPHY
- CRIMINAL SKILLS
- CULTS
- DAILY LIVING
- DATING
- DOWNLOADS
- DRUGS
- EDUCATION
- ENERGY
- ENTERTAINMENT
- FINANCE
- FOOD
- FORUMS
- GAMBLING

- GAMES
- GLAMOUR
- GORE
- GOVERMENT
- HACKING
- HATE
- HEALTH
- HOBBIES
- HOOLIGANS
- HOSTING
- JOKES
- KIDS
- LAW
- MAIL
- MILITARY
- MIXED CONTENT / PO- TENTIALLY ADULT
- MOBILES
- MUSIC
- NATIONALISM
- NEWS
- NON PROFIT
- OCCULTS
- PEER 2 PEER
- PETS
- PHOTOS

- PLACEHOLDERS
- PLAGIARISM
- PLASTIC SURGERY
- POLITICS
- PORNOGRAPHY
- REAL ESTATE
- REFERENCE
- RELIGION
- SCIENCE
- SEARCH ENGINES/ PORTALS
- SELFHARM
- SEX EDUCATION
- SHARING
- SHOPS
- SPORT
- STREAMING
- SWEARS
- TATTOOS & PIERCING
- TECHNOLOGY
- TOBACCO
- TRAVEL
- UNCLASSIFIED
- VIOLENCE
- VOIP
- WEAPONS

Masz pytania?


passus@passus.com

+48 695 444 803