5
DiffBot
* Získejte data z webových stránek automaticky: Rozhraní API pro počítačové vidění společnosti Diffbot promění web do vaší databáze.* AUTOMATIC API: Extrahujte automatickyZískejte strukturovaný obsah z článků, produktů a jiných známých typů stránek.
- Placená
- Web
Proč Diffbot?Zaměřujeme se výhradně na získání lepších webových dat.Některé z důvodů, proč stovky zákazníků každý měsíc (stovky) miliónů hovorů: # Nejlepší webový extraktor obsahu: Diffbot pracuje automaticky - bez pravidel nebo školení.Neexistuje lepší způsob, jak extrahovat data z webových stránek.Podívejte se, jak se Diffbot hromadí s jinými metodami extrakce obsahu: Srovnání vlastností Textový extrakční rozstřel #Identifikace stránek automaticky: Pomocí API pro analýzu můžete automaticky vyhledat a extrahovat všechny produkty, články, diskuse nebo obrázky při procházení libovolného webu.Analyzovat API #Detailed product data: Product API automaticky vrací kompletní informace o produktu, včetně všech cenových údajů, ID produktů, značek a tabulek úplných specifikací.Product API #Clean text and html: Články, diskusní vlákna, popisy produktů a titulky obrázků jsou vráceny v čistě textu a dezinfikovaném HTML.Začněte testování ještě dnes # Strukturované vyhledávání: Prohledávejte strukturovaný obsah z jakéhokoli procházení za běhu pomocí našeho vyhledávacího rozhraní API a vracejte pouze odpovídající výsledky.Plus ... ¤ Všechna API spouští Javascript, takže obsah je analyzován jako běžný prohlížeč.¤ Práce na většině neanglických stránek díky vizuálnímu zpracování.Norm Normalizace data: Datová razítka jsou normalizována a prezentována ve standardním formátu RFC 1123 (HTTP / 1.1).¤ Více článků se automaticky spojí do jediné odpovědi API.Extraction Extrahování entit: automatické značkování identifikuje hlavní témata a entity v textu článku.¤ Opravte všechny problémy v reálném čase pomocí sady API Toolkit.¤ Hromadné API umožňuje extrakci stovek až stovek tisíc stránek.¤ Získejte přístup k datům úloh procházení a hromadného tisku v plném formátu JSON nebo CSV.¤ Volitelně můžete procházet pomocí různorodého pole IP adres.
diffbot