No estás registrado (Registrarse)

Vanilla 1.1.10 es un producto de Lussumo. Para más información: Documentación, Soporte.

    • CommentAuthorhostxxi
    • CommentTimeMay 27th 2008
     # 1
    Hola, me gustaría poder coger la info de esta web donde salen los precios de la gasolina en toda España

    http://www.mityc.es/Petroleo/Seccion/Precios/

    Les envié un mail para que de alguna forma me autorizaran a coger los datos y que si pudiera ser me dieran la fuente de datos y me dijeron que lo redirigían a no se quien mi email y ya no he tenido mas noticias.

    Alguien me puede decir o dar alguna idea de como otras webs cogen esta info y la utilizan?

    GraciasDominiosOn
    •  
      CommentAuthorAlfredo
    • CommentTimeMay 27th 2008
     # 2
    Como se hace ni idea, pero se llama Web Scraping revisa tambien Screen ScrapingThe Best Is Yet To Come |Dominios para principiantes
    • CommentAuthorhostxxi
    • CommentTimeMay 27th 2008
     # 3
    muchas gracias alfredo, por lo menos tengo algo de informacion.

    Por favor si alguien sabe algo mas y quiere aportar...

    Yo publicaré todos mis avances:matu:DominiosOn
    • CommentAuthorJCDomainer
    • CommentTimeMay 27th 2008
     # 4
    La pregunta fundamental es: ¿Que sabes de programación?
    Hoy varias y distintas formas PERO se necesita saber algunas cosas.
    Sabes PHP? Perl?
    •  
      CommentAuthormarchelo
    • CommentTimeMay 27th 2008
     # 5
    tambien quiero saber como se hace eso, pregunte por aca..La mejor venganza es el éxito.
    •  
      CommentAuthorvertigo
    • CommentTimeMay 27th 2008
     # 6
    yo lo llegue a hacer por medio de php, leia una direccion, la abria y parseaba las lineas que me interesaban

    :typeo:
    • CommentAuthorhostxxi
    • CommentTimeMay 28th 2008
     # 7
    Se php y puedo aprender lo que sea como buen informatico que soy:eyebrows:DominiosOn
    •  
      CommentAuthorXarlie
    • CommentTimeMay 28th 2008
     # 8
    Con php puedes utilizar snoopy_class para leer el contenido y algo de maña para parsear el contenido y adaptarlo...

    Tendrás que utilizar expresiones regulares para sacar el contenido, lo más fácil es buscar un patrón, al ser páginas dinámicas suelen tener patrones repetidos con los datos. Localizas el patrón, lo sacas, lo limpias y 'pa la saca'
    :typeo:Programas de afiliación - Plantillas Web - Productos de belleza
    • CommentAuthorJunior
    • CommentTimeMay 28th 2008
     # 9
    Eso es legal, no??

    Me refiero a lo de pillar la información y ponerla en tu web. Supongo que si, pero por confirmarlo...Reflexiones de la vida
    •  
      CommentAuthorXarlie
    • CommentTimeMay 28th 2008
     # 10
    Legal no lo es mucho si no tienes permiso para copiar sus contenidos...Programas de afiliación - Plantillas Web - Productos de belleza
    •  
      CommentAuthorkrasti
    • CommentTimeMay 28th 2008 editado
     # 11
    y detectable? :susurro:

    Lo de legal o no depende del contenido. Si es un contenido público, como el precio del gasoil, a priori no debería ser ilegal.Bajar Peso Adelgazar Bautizo Directorio Gratis
    •  
      CommentAuthornets
    • CommentTimeMay 28th 2008
     # 12
    Legal al tratarse de datos del estado creo no tiene porque haber problemas al ser documentos oficiales, se pueden reproducir..

    Ahora bien, será mejor informarse bien con un experto.. ;)

    Saudos!Compramania Curso de Google Ads | Desarrollo web de todos los niveles. SEO. Contáctame.
    •  
      CommentAuthordomainer
    • CommentTimeMay 28th 2008
     # 13
    Vayamos por partes
    Como bien dicen los compis, los datos los tendrás que recoger a base de screen scrapping, asi es como lo hago yo, por lo menos. En cuanto a si es legal o no. Debería porque en la misma página web se aclara lo siguiente.


    4. Me interesa obtener información que apareció en este sitio. ¿La puedo solicitar?
    La información que aparece en estas páginas es pública. Se debe obtener a través de estas mismas páginas.
    •  
      CommentAuthorXarlie
    • CommentTimeMay 28th 2008
     # 14
    Posted By: krastiy detectable?


    No es detectable a no ser que te líes a realizar las peticiones cada 2 minutos y ellos estén continuamente mirando los logs... que lo dudo mucho porque seguro que son funcionarios y seguramente aprovecharan ese tiempo para tomarse el cafetito de las 9, las 11 y las 13 :cata2:Programas de afiliación - Plantillas Web - Productos de belleza
    • CommentAuthorhostxxi
    • CommentTimeMay 28th 2008
     # 15
  1.  # 16
    ¿Queréis que os haga un script para que podáis conseguir esos datos? Yo tengo pensado usar uno de los servidores Hosteap para alojar los datos y que cada uno lo coja desde su web mediante un código que os será proporcionado.

    Así lo tenéis fácil.
    •  
      CommentAuthorByron
    • CommentTimeMay 28th 2008
     # 17
    otros enlaces que pueden ayudar...

    http://www.russellbeattie.com/blog/using-php-to-scrape-web-sites-as-feeds

    http://www.merchantos.com/makebeta/php/scraping-links-with-php/Blog de tecnología|top ssl providers|Sitios Web|Watches|AI News