मेरे पास दो सेट हैं
tf_ar = [0.0,0.032,0.235,0.65,0 , ....] और idf = [1.2,1.6,0.68, ....]
मुझे idf और tf_ar के गुणन करना है ताकि आईडीएफ में प्रत्येक शब्द छह से गुणा Tf_ar में शर्तें इसका मतलब है कि
(tf_ar में शब्दों की संख्या) = [6 * (आईडीएफ में शब्दों की संख्या)]
मुझे शर्तों को कैसे देना चाहिए इसके लिए, यह अगले छह शब्दों के लिए tf_ar में लूप जारी रहेगा?
j = 0 आईडीएफ में शब्द: i = 0 tf_ar में: अगर मैं == 6: तोड़ना अन्य: उदाहरण के लिए: tf_idf + = str (फ्लोट (टीएफ) * idf [j]) + ',' i + = 1 tf_idf = tf_idf.strip () + '\ n' j + = 1
उदाहरण के लिए:
tf_ar = [1,2,3,4,5,6,7,8,9,10,11,12 ...] idf = [ए, बी, ... ]
मुझे
tf_idf = [1 ए, 2 ए, 3 ए, 4 ए, 5 ए, 6 ए, 7 बी, 8 बी, 9 बी, 10 बी, 11 बी के रूप में परिणाम चाहिए , 12B ...]
मुझे लगता है कि आईडीएफ को छह शब्दों से गुणा किया जाना चाहिए और इसे अगले शब्दों से जारी रखना चाहिए।
एक पूर्णांक इंडेक्स को पुनरावृत्ति के साथ जाने के लिए "गणना" करना है idf
से अधिक, फिर tf_ar
के [x: y] के साथ "स्लाइस" करें, जो 6 चौरे हैं।
Comments
Post a Comment