AnsweredAssumed Answered

スクレイピングする場合ポジションでの逆引き

Question asked by takalovene on Feb 15, 2016
Latest reply on Feb 29, 2016 by takalovene

参考のソースが下記なのですが

カテゴリーだけ取り出したい場合

前列のポジションを取得する場合

アドレスなどの変動するキーワードだと

規則的にカテゴリA,カテゴリB,カテゴリCを取得出来ないので

</a>から前列の最初の">までがどれだけということで取得するのが良いと思いました。

しかし、ポジションなどの関数などでこちらを取得していくのは不可能かなと思いました。

逆引きして取得する方法などありますでしょうか。

 

 

<div id="wayfinding-breadcrumbs_container" class="a-section a-spacing-none a-padding-medium">

<div id="wayfinding-breadcrumbs_feature_div" class="a-subheader a-breadcrumb feature" data-feature-name="wayfinding-breadcrumbs">

    <ul class="a-horizontal a-size-small">

         <li><span class="a-list-item">

            <a class="a-link-normal a-color-tertiary" href="変数のアドレス長さも変わる可能性ありA">

                カテゴリA

            </a>

         </span></li>

         <li class="a-breadcrumb-divider"><span class="a-list-item a-color-tertiary">

             &rsaquo;

         </span></li>

         <li><span class="a-list-item">

            <a class="a-link-normal a-color-tertiary" href="/変数のアドレス長さも変わる可能性ありB">

                カテゴリB

            </a>

         </span></li>

         <li class="a-breadcrumb-divider"><span class="a-list-item a-color-tertiary">

             &rsaquo;

         </span></li>

         <li><span class="a-list-item">

            <a class="a-link-normal a-color-tertiary" 変数のアドレス長さも変わる可能性ありC">

                カテゴリC

            </a>

         </span></li>

    </ul>

</div>

</div>

Outcomes