Como Extrair Todos Os Links

Índice:

Como Extrair Todos Os Links
Como Extrair Todos Os Links

Vídeo: Como Extrair Todos Os Links

Vídeo: Como Extrair Todos Os Links
Vídeo: 216 - Excel VBA - Como extrair todos os hiperlinks de páginas WEB - WebScraping 2024, Maio
Anonim

A Internet vive de links. Ao clicar nos links, os usuários se movem entre as páginas dos sites. Ao publicar links, a atenção é atraída para recursos interessantes. Os links são usados pelos mecanismos de pesquisa para reabastecer a base de pesquisa e calcular os parâmetros usados na classificação. Os links são a espinha dorsal da web. É por isso que a vinculação correta e a estrutura correta do link são tão importantes para todos os recursos. E é por isso que todo webmaster deve saber a resposta à questão de como extrair todos os links de um site, de uma página individual ou de um grupo de páginas.

Como extrair todos os links
Como extrair todos os links

É necessário

  • - o programa gratuito Xenu's Link Sleuth, disponível para download em
  • - Conexão de internet.

Instruções

Passo 1

Crie um novo projeto no Link Sleuth do Xenu. No menu principal do aplicativo, selecione o item "Arquivo" e depois "Verificar URL …", ou pressione o atalho de teclado Ctrl + N. Na caixa de diálogo "Ponto de partida do Xenu" que aparece, no campo superior, digite a URL da página da qual deseja começar a extrair os links. Se necessário, preencha os campos no grupo de controles "Incluir / Excluir" para adicionar endereços externos e grupos de endereços adicionais a uma lista de verificação possível e bloquear à força alguns endereços ou grupos de endereços de serem indexados pelo aplicativo.

Passo 2

Defina os parâmetros do programa. Na caixa de diálogo "Ponto de partida do Xenu", clique no botão "Mais opções …". A caixa de diálogo "Opções" será exibida. Mude para a guia "Básico" da caixa de diálogo. Defina o número de threads paralelos que baixam dados da Internet movendo o controle deslizante "Threads paralelos". No campo "Profundidade máxima", insira um valor para a profundidade máxima do aplicativo para visualizar os links. No grupo de elementos "Relatório", ative ou desative as opções de geração do relatório. Mude para a guia "Avançado". Ative ou desative opções adicionais. Na caixa Novas tentativas, insira um valor para o número máximo de novas tentativas de URL em caso de falha. Clique no botão "OK".

etapa 3

Obtenha uma lista de páginas e links do site. Na caixa de diálogo "Ponto de partida do Xenu", clique no botão "OK". O aplicativo começará a funcionar. A barra de status exibirá informações sobre o andamento do processo de aquisição de dados. Aguarde a conclusão do processo. Na janela com um pedido de criação de um relatório (janela com o texto "Detector de link concluído. Deseja um relatório?") Clique no botão "Não".

Passo 4

Extraia todos os links de uma única página. Na lista de páginas que o aplicativo construiu, encontre a página cujos links você deseja extrair. Clique com o botão direito na linha correspondente. No menu de contexto, selecione o item "Propriedades do URL". O campo "… links nesta página" da caixa de diálogo exibida conterá uma lista de todos os links presentes na página. O campo "… com link para este" conterá os endereços das páginas com link para este.

Etapa 5

Extraia todos os links do site. No menu principal, selecione "Arquivo" e, em seguida, "Exportar Mapa da Página para Arquivo Separado por TAB …". Na caixa de diálogo que aparece, especifique o nome e o caminho para salvar o arquivo. O arquivo resultante contém todos os endereços de referência e direcionamento de páginas nos campos OriginPage e LinkToPage. O campo LinkToPageStatus contém os valores para o sucesso da operação de recuperação de dados do servidor. Importe o arquivo para um banco de dados (como o MS Access) para extrair links com base em seus critérios.

Recomendado: