Hola,
Soy un freelancer a tiempo completo y sólo trabajo de raspado web. Estoy creando sistemas automatizados de extracción de datos por más de dos años. Cualquier seguridad puede ser anulada. Ya he raspado millones de registros de decenas de sitios web. Algunos de los sitios web estaban protegidos (prohibición de la dirección IP, no mostrando resultados, etc.). Soporte de proxy es una necesidad cuando estamos hablando de sitios web seguros.
Puedo raspar cualquier sitio web utilizando cualquier tecnología (captchas, solicitudes ajax, etc). Puedo proporcionar datos raspados en cualquier formato que desee: csv, excel, xml, mysql, etc También puedo proporcionarle el programa que utiliza para raspar ese sitio web. Estoy desarrollando mis programas en python, java, .net, perl y usted Puede ejecutarlos en Windows, Mac y máquinas Linux / Unix.
He trabajado con los conductores web de raspado en múltiples proyectos de raspado web en Python, C # y Java. También en muchos proyectos de automatización de pruebas. También tienen conocimiento de trabajo / codificación en el raspado escalable multi-threaded.
Gracias