Back to Question Center
0

Semalt - Ciamar a sgrìobhas duilleagan-lìn?

1 answers:

'S e leabharlann Python a th' ann an Beautiful Soup air a chleachdadh gu farsaing airson duilleagan lìn a sgrìobadh le bhith a 'cruthachadh craobh bho sgrìobhainnean XML agus HTML. Tha sgrìobadh lìn, dòigh air dàta a tharraing bho làraich-lìn agus duilleagan, air a chleachdadh gu farsaing ann am mion-sgrùdadh dàta agus raointean riaghlaidh. Anns a 'mhòr-chuid de shuidheachaidhean, tha cànan prògramadh Python riatanach ann an saidheans dàta.

Python 3 innealan sgrìobadh agus modalan a dh'fhaodas tu a chur a-steach don phròiseact rianachd dàta agad. An-dràsta a 'ruith mar Beautiful Soup 4, tha am modal seo co-chòrdail ri Python 3 agus Python 2. 7 - stoff fell pink. Tha modal Beautiful Soup 4 comasach air craobh pàisidh a chruthachadh airson brot tag nach eil dùinte. San oideachadh seo, ionnsaichidh tu ciamar a sgrìobhas tu an duilleag agus sgrìobhaidh tu an dàta a chaidh a sgrìobadh gu faidhle CSV.

A 'tòiseachadh

Airson tòiseachadh, cuir air dòigh frithealaiche no àrainneachd còd Python stèidhichte air a' bhaile air do PC. Bu chòir dhut cuideachd modal Beautiful Soup and Requests a stàladh air an inneal agad. Tha e cuideachd riatanach eòlas fhaighinn air obrachadh leis an dà mhodal. Tha eòlas air tagradh HTML agus structar cuideachd na bhuannachd a bharrachd.

Tuigsinn an dàta agad

Sa cho-theacsa seo, thèid dàta fìor bho Gailearaidh Nàiseanta Ealain a chleachdadh gus do chuideachadh gus tuigsinn mar a chleachdas tu Beautiful Soup 4. Tha Gailearaidh Nàiseanta Ealain a 'dèanamh suas de 120,000 pìos a tha air a dhèanamh le tuairmse de 13,000 neach-ealain. Tha an Ealain stèidhichte ann an Washington D. C, na Stàitean Aonaichte.

Chan eil e a 'toirt a-mach dàta lìn le Beautiful Soup cho duilich. Mar eisimpleir, ma chuireas tu fòcas air litir Z, comharraich agus comharraich sìos a 'chiad ainm air an liosta. Anns a 'chùis seo, is e Zabaglia, Niccola a' chiad ainm. Airson cunbhalachd, comharraich àireamh nan duilleagan agus ainm an neach-ealain mu dheireadh air an duilleig sin.

Mar a chuireas tu iarrtasan a-steach agus leabharlann Beautiful Soup

Gus leabharlannan a thoirt a-steach, an àrainneachd phrògraman Python 3 agad a ghnìomhachadh. Dèan cinnteach gu bheil thu san aon eòlaire leis an àrainneachd phrògramachaidh agad. Rach an òrdugh a leanas airson tòiseachadh. my_env / bin / gnìomhaich.

Cruthaich faidhle ùr agus tòiseachadh le bhith a 'toirt a-steach leabharlainn Beautiful Soup and Requests. Leigidh leabharlann iarrtasan dhut HTTP a chleachdadh taobh a-staigh nam prògraman Python agad ann an cruthan leughaidh. Bidh an t-searbh caran, air an làimh eile, ag obair gus duilleagan a sgrìobadh gu sgiobalta. Cleachd bs4 gus a bhith a 'toirt a-steach bòt àlainn.

Ciamar a chruinnicheas tu agus phasgaich duilleag lìn

A 'cleachdadh iarrtasan, cruinnich URL air a' chiad duilleag agad. Thèid URL den chiad duilleag a shònrachadh don duilleag caochlaideach. Tog cuspair BeautifulSoup bho Iarrtasan agus cuir a 'chùis ris a' chuspair bho parser Python.

Anns an oideachadh seo, is e an t-amas ceanglaichean a chruinneachadh agus ainmean an luchd-ealain. Mar eisimpleir, faodaidh tu cinn-latha luchd-ealain agus nàiseanan a chruinneachadh. Do luchd-cleachdaidh Windows, cliog deas air a 'chiad ainm aig an neach-ealain. Anns a 'chùis seo, cleachd Zabaglia, Niccola. Airson luchd-cleachdaidh Mac OS, tog "CTRL" agus briog air an ainm. Cliog air a 'chlàr-taice "Element Element" a bhios a' nochdadh air an scrion agad gus faighinn gu innealan luchd-leasachaidh lìn. Clò-bhuail ainm an neach-ealain a-mach gus Beautiful Soup a dhèanamh a 'dèanamh craobh gu luath.

A 'toirt air falbh na ceanglaichean gu h-ìosal

Gus na ceanglaichean gu h-ìosal a thoirt air do dhuilleag lìn, sgrùdadh an DOM le cliogadh deas air an eileamaid. Nochdaidh tu gu bheil na ceanglaichean fo bhòrd HTML. A 'cleachdadh Beautiful Soup, cleachd an "dòigh mì-mhodhail" gus tagaichean a thoirt às a' chraobh phasgain.

Mar a tharraing thu susbaint bho chlib

Chan fheum thu clò-bhualadh a dhèanamh air a 'cheangal ceangail gu lèir, cleachd Beautiful Soup gus stuth a thoirt à tag. Faodaidh tu cuideachd URL a ghlacadh a tha co-cheangailte ris an luchd-ealain le bhith a 'cleachdadh Beautiful Soup 4.

A 'glacadh dàta air an sgrìobadh gu faidhle CSV

Leigidh faidhle CSV dhut dàta structaraichte a stòradh ann an teacsa sìmplidh, cruth a tha gu ìre mhòr air a chleachdadh airson clàran-dàta. Thathar a 'moladh eòlas air làimhseachadh faidhlichean teacsa sìmplidh ann am Python.

Thathar a 'cleachdadh togail dàta lìn airson duilleagan a sgrìobadh agus fiosrachadh fhaighinn. Bi mothachail air na làraich-lìn a tha thu a 'tarraing às fiosrachadh bho. Bidh cuid de làraichean-lìn fiùghantach a 'cuingealachadh sgaoileadh dàta lìn air na làraichean aca. Gus sgrìobadh duilleag le Beautiful Soup agus Python 3 tha sin sìmplidh.

December 22, 2017