軽量なWebスクレイピングスクリプト。ユニバーサルサイトコンテンツクロールツール、クロール、フォーラム内容など
[ウェブページをハイライトまたはフォーマットするボックスにコードを入力し、単語数を数えます]
ウェブページのメインコンテンツをダウンロードするために使用される軽量のクロールスクリプト。理論的には、Ajax以外の新しいウェブサイト、フォーラム、ポストバーなどを作成するのに適しています。ルールを作成する必要はありません。
スクリプトはページのメインコンテンツを自動的に取得してダウンロードします(ギャルガイドをコピーした後、「XXクライアントからX年X月X日に公開された13レベルのタイトルWater Dragon King」を手動で削除する必要はありません)。 小説のカタログページにある場合は、すべての章をトラバースして並べ替え、TXTファイルとして保存します。
❤️Buy me a coffee if it helps you with PayPal.Me or Ko-fi.
CTRL + F9を押すか、コマンドメニューをクリックしますSHIFT + CTRL + F9を押してディレクトリを無視し、現在のページのみをダウンロードしますこの作業には7つのレベルがあり、最初のレベルが最も簡単で、7番目のレベルが最も困難です。
CTRL + F9以上です。
チャプターリンクにxxチャプター、xxセクション、xxワードなどの特徴的な単語がない場合は、[カスタムダウンロード]をクリックし、「Windmill of the Gods」などのチャプター名を入力して、すべてのリンクにマークを付けることができます。目次の章と同じレベルでダウンロードしてください。ページに2つの章形式がある場合は、「神々の風車、風車の神々」など、複数の章の形式をマークできます。また、「神々の風車01!02!03、風車の神々!鉄のカーテン」などの除外マークを付けることもできます。これは、同じレベルのリンクに「神々の風車01」とマークが付けられていることを意味します。 02を含むアイテムと03を含むアイテムは除外されます。同時に、同じレベルで「Windmill Gods」リンクをマークし、「IronCurtain」を含むアイテムを除外します。
内側のページにテキストがないが、章のリンクが実際のコンテンツのリンクに関連している場合は、カスタムダウンロードを使用してリンクのコンテンツを置き換えることで実際のコンテンツを取得できます。たとえば、[the windmill of the gods @@ articles @@ articlescontent]の場合、章のURLの記事をarticlescontentに置き換えることができます。
リンクを直接置き換えて最終的なアドレスを取得できない場合は、通常のリンクに置き換えることができます。たとえば、[The windmill of the gods @@ articles(\ d +)@@ articlescontent_ $ 1b]、articles1を置き換えることができます。章のURLのarticles2
articlescontent_1b、articlescontent_2b
入力チャプターのcssセレクターは、チャプターリンクをより正確にマークできます。たとえば、 .l_chaptname> aは、クラスがl_chaptnameである要素の下のリンクを表します。
ダウンロードしたコンテンツに干渉コードが含まれている可能性があります。このとき、レイジーノベルダウンロード設定をクリックし、干渉コードのcssセレクターを入力して、干渉コードを削除してください。たとえば、 .mask、.ksamは、クラスがmaskまたはksamである要素を削除することを意味します。
内側のページの本文が内側のページの本文でない場合は、ページが読み込まれた後に処理されます。[カスタムダウンロード]をクリックし、カスタムコードを入力して内側のページを分析し、正しい結果を得ることができます。たとえば、[The windmill of the gods @@@@@@ var noval = JSON.parse(data.querySelector("#meta-preload-data ")。content).novel; noval [Object.keys(noval)[ 0]] .content;]、テキストを無視して、カスタムコード処理を通じてコンテンツを取得するためにリターンページのみを処理できます。コード内のデータを使用して、返されたページのドキュメントを取得します。最後の式の値は、最終的に書き込まれるコンテンツです。
テキストが暗号化されており、正しいコンテンツを取得するために復号化する必要がある場合は、ブラウザコンソールを開き、dacProcess関数をカスタマイズし、ページ内のWebサイト独自の復号化コードを呼び出して、キャプチャされた暗号化データを処理できます。たとえば、コンソール入力 dacProcess = data => {return decode(xxx);}は、Webサイトの復号化チャプターページを呼び出すことによって返されるデータを表します。次に、[カスタムダウンロード]をクリックします。カスタムダウンロード時にチャプターにマークを付ける必要があることに注意する必要があります。
【オイルモンキーコマンドメニューから以下の機能を入力する必要があります】
.mask、.ksamなどの干渉コードのcssセレクターに入力します。これは、クラスがmaskまたはksamである要素を削除することを意味します。特定のチャプター名/CSSセレクター[セレクターの後に>>処理コードを追加するための着信アイテム]@@リンクの通常の一致がキャプチャされます@@対応する一致が生成されます置換URL*@@*クロールされた返されたコンテンツデータに従って最終的なテキストを処理して返します
.l_chaptname> aです。入力してダウンロードした後、本文のコンテンツをダウンロードできないことがわかりました。 URL、本文はajaxですarticlescontent経由でダウンロードされます。このとき、 @@ articles @@ articlescontent(@@区切り)に従って、章のURLの記事をarticlescontentに置き換えることができます。要約すると、** .l_chaptname> a @@ articles @@ articlescontent **をこのサイトに適合させることができます。最初の記事は通常のルールを使用できます。たとえば、 @ articles(\ d +)@@ $ 1contentは、リンク内の「articles1」、「articles2」などを「1content」「2content」に置き換えることを意味します。main> section ul> li> div> aで、置き換える必要はありません。リンクなので、2つの空白を残します。 6 @now😂があります。テキストはメタにあり、メタプリロードデータのコンテンツアイテムを抽出するようにコードをカスタマイズする必要があります。要約すると、** main> section ul> li> div> a @@@@@ var noval = JSON.parse(data.querySelector("#meta-preload-data ")。content).novel; noval [Object。 keys(noval)[0]]。content;** pステーションの小説をダウンロードできます。その中で、「data」はクロールされたWebページのドキュメントオブジェクトを表します。返されるテキストがプレーンテキストの場合は、 data.body.innerTextを使用して取得します。Buy me a coffee if it helps with PayPal.Me

主に
馳星周の漂流する通りをダウンロードしたいのですが、前任者の「[Fiction] Download Script」のホイールが利用できないことがわかり、この壊れたステーションのルールを書きたくないので🙃、私はただあなたを横切る圧倒的なXiuxian大統領を見下します私をかみます多分それは3日で2回改訂されるでしょう。一般的なルールのスクリプトを作成します。第一に、適応、変更、更新するために無数の新しいサイトを追跡する必要がなく、第二に、法的リスクを回避します。
このスクリプトは、メインコンテンツを自動的に検索し、ルールを記述せずにダウンロードします。もちろん、あなたのウェブサイトが本文よりも多くの広告を持っているなら、私はそれを助けることができません。
特別なウェブサイトに出会うときは、「[フィクション]ダウンロードスクリプト」を使用することをお勧めします。