
啊哦!似乎我们马上就遇到了一个错误。这里我就不细讲了,但是有时候我们必须对SelectorGadget保持谨慎。这是一个很好的工具,通常可以完美地工作。然而,有时候看起来正确的选择(例如,用黄色突出显示的东西)并不是我们想要的。我特意选择了这个Wikipedia 100m的例子,因为我想展示这个潜在的陷阱。再次强调:网络抓取既是一门科学,也是一门艺术。

  • read_html读取html页面
  • html_node结合css得到内容
  • html_table得到表格内容
  • as_tibble转换数据框
  • clean_names得到整洁列名称
  • mutate对列进行处理
  • ggplot对数据进行可视化