#new_cases
Explore tagged Tumblr posts
Text
How you can use python for data wrangling and analysis
Python is a powerful and versatile programming language that can be used for various purposes, such as web development, data science, machine learning, automation, and more. One of the most popular applications of Python is data analysis, which involves processing, cleaning, manipulating, and visualizing data to gain insights and make decisions.
In this article, we will introduce some of the basic concepts and techniques of data analysis using Python, focusing on the data wrangling and analysis process. Data wrangling is the process of transforming raw data into a more suitable format for analysis, while data analysis is the process of applying statistical methods and tools to explore, summarize, and interpret data.
To perform data wrangling and analysis with Python, we will use two of the most widely used libraries: Pandas and NumPy. Pandas is a library that provides high-performance data structures and operations for manipulating tabular data, such as Series and DataFrame. NumPy is a library that provides fast and efficient numerical computations on multidimensional arrays, such as ndarray.
We will also use some other libraries that are useful for data analysis, such as Matplotlib and Seaborn for data visualization, SciPy for scientific computing, and Scikit-learn for machine learning.
To follow along with this article, you will need to have Python 3.6 or higher installed on your computer, as well as the libraries mentioned above. You can install them using pip or conda commands. You will also need a code editor or an interactive environment, such as Jupyter Notebook or Google Colab.
Let’s get started with some examples of data wrangling and analysis with Python.
Example 1: Analyzing COVID-19 Data
In this example, we will use Python to analyze the COVID-19 data from the World Health Organization (WHO). The data contains the daily situation reports of confirmed cases and deaths by country from January 21, 2020 to October 23, 2023. You can download the data from here.
First, we need to import the libraries that we will use:import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns
Next, we need to load the data into a Pandas DataFrame:df = pd.read_csv('WHO-COVID-19-global-data.csv')
We can use the head() method to see the first five rows of the DataFrame:df.head()
Date_reportedCountry_codeCountryWHO_regionNew_casesCumulative_casesNew_deathsCumulative_deaths2020–01–21AFAfghanistanEMRO00002020–01–22AFAfghanistanEMRO00002020–01–23AFAfghanistanEMRO00002020–01–24AFAfghanistanEMRO00002020–01–25AFAfghanistanEMRO0000
We can use the info() method to see some basic information about the DataFrame, such as the number of rows and columns, the data types of each column, and the memory usage:df.info()
Output:
RangeIndex: 163800 entries, 0 to 163799 Data columns (total 8 columns): # Column Non-Null Count Dtype — — — — — — — — — — — — — — — 0 Date_reported 163800 non-null object 1 Country_code 162900 non-null object 2 Country 163800 non-null object 3 WHO_region 163800 non-null object 4 New_cases 163800 non-null int64 5 Cumulative_cases 163800 non-null int64 6 New_deaths 163800 non-null int64 7 Cumulative_deaths 163800 non-null int64 dtypes: int64(4), object(4) memory usage: 10.0+ MB “><class 'pandas.core.frame.DataFrame'> RangeIndex: 163800 entries, 0 to 163799 Data columns (total 8 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 Date_reported 163800 non-null object 1 Country_code 162900 non-null object 2 Country 163800 non-null object 3 WHO_region 163800 non-null object 4 New_cases 163800 non-null int64 5 Cumulative_cases 163800 non-null int64 6 New_deaths 163800 non-null int64 7 Cumulative_deaths 163800 non-null int64 dtypes: int64(4), object(4) memory usage: 10.0+ MB
We can see that there are some missing values in the Country_code column. We can use the isnull() method to check which rows have missing values:df[df.Country_code.isnull()]
Output:
Date_reportedCountry_codeCountryWHO_regionNew_casesCumulative_casesNew_deathsCumulative_deaths2020–01–21NaNInternational conveyance (Diamond Princess)WPRO00002020–01–22NaNInternational conveyance (Diamond Princess)WPRO0000……………………2023–10–22NaNInternational conveyance (Diamond Princess)WPRO07120132023–10–23NaNInternational conveyance (Diamond Princess)WPRO0712013
We can see that the missing values are from the rows that correspond to the International conveyance (Diamond Princess), which is a cruise ship that had a COVID-19 outbreak in early 2020. Since this is not a country, we can either drop these rows or assign them a unique code, such as ‘IC’. For simplicity, we will drop these rows using the dropna() method:df = df.dropna()
We can also check the data types of each column using the dtypes attribute:df.dtypes
Output:Date_reported object Country_code object Country object WHO_region object New_cases int64 Cumulative_cases int64 New_deaths int64 Cumulative_deaths int64 dtype: object
We can see that the Date_reported column is of type object, which means it is stored as a string. However, we want to work with dates as a datetime type, which allows us to perform date-related operations and calculations. We can use the to_datetime() function to convert the column to a datetime type:df.Date_reported = pd.to_datetime(df.Date_reported)
We can also use the describe() method to get some summary statistics of the numerical columns, such as the mean, standard deviation, minimum, maximum, and quartiles:df.describe()
Output:
New_casesCumulative_casesNew_deathsCumulative_deathscount162900.000000162900.000000162900.000000162900.000000mean1138.300062116955.14016023.4867892647.346237std6631.825489665728.383017137.25601215435.833525min-32952.000000–32952.000000–1918.000000–1918.00000025%-1.000000–1.000000–1.000000–1.00000050%-1.000000–1.000000–1.000000–1.00000075%-1.000000–1.000000–1.000000–1.000000max -1 -1 -1 -1
We can see that there are some negative values in the New_cases, Cumulative_cases, New_deaths, and Cumulative_deaths columns, which are likely due to data errors or corrections. We can use the replace() method to replace these values with zero:df = df.replace(-1,0)
Now that we have cleaned and prepared the data, we can start to analyze it and answer some questions, such as:
Which countries have the highest number of cumulative cases and deaths?
How has the pandemic evolved over time in different regions and countries?
What is the current situation of the pandemic in India?
To answer these questions, we will use some of the methods and attributes of Pandas DataFrame, such as:
groupby() : This method allows us to group the data by one or more columns and apply aggregation functions, such as sum, mean, count, etc., to each group.
sort_values() : This method allows us to sort the data by one or more
loc[] : This attribute allows us to select a subset of the data by labels or conditions.
plot() : This method allows us to create various types of plots from the data, such as line, bar, pie, scatter, etc.
If you want to learn Python from scratch must checkout e-Tuitions to learn Python online, They can teach you Python and other coding language also they have some of the best teachers for their students and most important thing you can also Book Free Demo for any class just goo and get your free demo.
#python#coding#programming#programming languages#python tips#python learning#python programming#python development
2 notes
·
View notes
Text
ہندوستان میں کورونا کے 2.47 لاکھ نئے کیسز
ہندوستان میں کورونا کے 2.47 لاکھ نئے کیسز
ہندوستان میں کورونا کے 2.47 لاکھ نئے کیسز نئی دہلی،13؍ جنوری(آئی این ایس انڈیا) ہندوستان میں گزشتہ 24 گھنٹوں کے دوران کورونا کیسز میں27 فیصد کا اضافہ درج کیا گیا ہے۔ گزشتہ ایک دن میں 2,47,417 نئے کورونا کیسز درج ہوئے ہیں۔ واضح رہے کہ بدھ کو ملک میں کل 1,94,720 کیسز درج ہوئے اور ایک ہی دن میں یہ تعداد 2.5 لاکھ کے قریب پہنچ گئی ہے۔ کیسز اتنی تیزی سے بڑھ رہے ہیں کہ گزشتہ16 دنوں میں کووڈ کے…
View On WordPress
0 notes
Link
0 notes
Text
Data Management for Quantitative Variables
My Hypothesis: Alcohol consumption is one of the high risk factors for acquiring Breast cancer and both these factors influence on Life Expectancy.
For the analysis I have taken three variables from the Gapminder dataset: alcconsumption(2008 alcohol consumption per adult (age 15+), breastcancerper100TH (2002 breast cancer new cases per 100,000 female ), life expectancy (2011 life expectancy at birth (years)).
Since the variables of the gapminder data set are quantitative variables , data management for these variables is required. Due to large number of unique values that these variables take, I have grouped them into secondary variables level, new_cases, and span respectively.
For alcohol consumption rate, anything below 2 L falls under low level indicating 1 , less than 4 L indicates 2 level (medium level) and less than 8 L indicates level 3 (High level) and anything above 8 L indicates level 4(Very High level). For new cases of breast cancer, cases below 25 falls under low risk indicating 1, less than 50 indicates new_cases 2 (medium level) and less than 75 indicates new_cases 3 (high risk) and anything above 75 indicates new_cases 4 (very high risk) . For life expectancy, anything below 50 falls under low span indicating 1, less than 75 indicates span 2 (normal span), and anything above 75 indicates span 3 (High span).
The following is the SAS code for data management of the variables.
From the results , we can infer that in majority of the countries the rate of alcohol consumption is higher than the normal level as indicated in the first table. From the second table we can see that very minimal percent of countries have shorter lifespan and more than 50% of the countries have a normal life span. From the last table we can see that around 50% of the new cases are low risk and only 12.68% and 8.45% are classified under high and very high risk.
0 notes
Text
देश में 24 घंटे में कोरोना के रिकॉर्ड 15968 नए केस आए सामने, 465 लोगों की मौत
देश में 24 घंटे में कोरोना के रिकॉर्ड 15968 नए केस आए सामने, 465 लोगों की मौत #new_cases
नईदिल्ली, देश में पिछले 24 घंटे में कोरोना के सर्वाधिक 15,968 नए मामले सामने आए और 465 मौतें हुईं। देश में अब कोरोना पॉजिटिव मामलों की कुल संख्या 4,56,183 हो गई है, जिनमें 1,83,022 सक्रिय मामले हैं और 2,58,685 लोगों को डिस्चार्ज किया जा चुका है। अब तक कोरोना से 14,476 लोगों की मौत हो चुकी है।
महाराष्ट्र में अब जहां कोरोना संक्रमित 1 लाख 39 हजार तक पहुंच गए हैं तो वहीं दिल्ली में 66 तो…
View On WordPress
0 notes
Text
ملک میں تیسری لہر کی دستک ؟ نئے کیسز اوراموات کی تعداد میں اضافہ
ملک میں تیسری لہر کی دستک ؟ نئے کیسز اوراموات کی تعداد میں اضافہ
ملک میں تیسری لہر کی دستک ؟ نئے کیسز اوراموات کی تعداد میں اضافہ نئی دہلی،28؍اگست (آئی این ایس انڈیا) ملک میں کورونا وائرس کے نئے کیسز تیزی سے بڑھ رہے ہیں۔ کچھ دن پہلے تک 30 ہزار سے نیچے آنے والے کیسز اب 45 ہزار سے تجاوز کر چکے ہیں جو کہ تشویش کا باعث ہے۔ اس دوران ملک میں تیسری لہر کا امکان بھی ظاہر کیا جا رہا ہے۔ گزشتہ 24 گھنٹوں کے دوران ملک بھر میں کورونا کے 46759 نئے کیس رپورٹ ہوئے ہیں۔ کل…
View On WordPress
0 notes
Text
کیرل میں کورونا کے نئے کیسز میں مسلسل اضافہ ، دو دن کے لیے لاک ڈاؤن کا اعلان
کیرل میں کورونا کے نئے کیسز میں مسلسل اضافہ ، دو دن کے لیے لاک ڈاؤن کا اعلان
کیرل میں کورونا کے نئے کیسز میں مسلسل اضافہ ، دو دن کے لیے لاک ڈاؤن کا اعلان نئی دہلی ،29؍جولائی (آئی این ایس انڈیا) کیرل میں کورونا کے نئے کیسوں میں ہونے والے اضافے کے پیش نظر ریاستی حکومت نے 31 جولائی اور یکم اگست کو مکمل لاک ڈاؤن نافذ کرنے کا فیصلہ کیا ہے۔ واضح رہے کہ بدھ کے روز کیرالا میں کورونا کے 22056 نئے کیسوں کی تصدیق ہوئی اور 131 مریضوں کی موت ہوئی۔ اس وقت ریاست میں 149534 مریض زیر…
View On WordPress
0 notes
Text
ہندوستان میں کورونا کے 43654 نئے مریضوں کی تصدیق ،640 اموات
ہندوستان میں کورونا کے 43654 نئے مریضوں کی تصدیق ،640 اموات
ہندوستان میں کورونا کے 43654 نئے مریضوں کی تصدیق ،640 اموات نئی دہلی ،28؍جولائی (آئی این ایس انڈیا) ہندوستان میں گزشتہ 24 گھنٹوں کے دوران کورونا کے43654 نئے کیسز درج ہوئے ہیں اور 640 افراد ہلاک ہو چکے ہیں۔ جبکہ گزشتہ24 گھنٹوں میں 41678 مریض صحت یاب ہو چکے ہیں۔ ہندوستان میں کورونا کے فعال کیسز 399436 ہیں اور صحت یاب ہونے والوں کی تعداد 97.39 ہے۔ اب تک ملک میں کورونا سے صحت یاب ہونے والے افراد کی…
View On WordPress
0 notes
Text
ہندوستان میں کورونا کے 35,342نئے کیسز،483 اموات
ہندوستان میں کورونا کے 35,342نئے کیسز،483 اموات
ہندوستان میں کورونا کے 35,342نئے کیسز،483 اموات نئی دہلی،23؍جولائی (آئی این ایس انڈیا) ملک میں کورونا کی دوسری لہر کا قہر برقرار ہے۔ روزانہ 30 سے 40 ہزار کے درمیان نئے کیس سامنے آرہے ہیں۔ اس دوران کورونا کی وجہ سے اموات کی تعداد میں بھی کمی واقع ہوئی ہے۔ جمعہ کو مرکزی وزارت صحت کی جانب سے جاری کردہ اعدادوشمار کے مطابق ہندوستان میں گذشتہ 24 گھنٹوں کے دوران 35342 نئے کیس درج ہوئے ہیں۔ اس دوران…
View On WordPress
0 notes
Text
ہندوستان میں کورونا کے 41,806نئے کیسز، 581 اموات
ہندوستان میں کورونا کے 41,806نئے کیسز، 581 اموات
ہندوستان میں کورونا کے 41,806نئے کیسز، 581 اموات نئی دہلی،15؍جولائی (آئی این ایس انڈیا) ملک میں کورونا کیسز مسلسل کم ہورہے ہیں۔ ہندوستان میں گزشتہ24 گھنٹوں کے دوران 41806 نئے کیس رپورٹ ہوئے اور 581 افراد ہلاک ہوئے ہیں۔ کل فعال کیسزکے بارے میں بات کریں تو ان کی تعداد 432, 041ہے۔ کورونا سے صحت یاب ہونے والے افراد کی تعداد 30143850ہے۔ گذشتہ 24 گھنٹوں میں 39,130مریض صحت یاب ہوئے ہیں۔ جبکہ مجموعی…
View On WordPress
0 notes
Text
ہندوستان میں کوروناکے 3.29 لاکھ سے زائد نئے کیسز ، 3876 اموات
ہندوستان میں کوروناکے 3.29 لاکھ سے زائد نئے کیسز ، 3876 اموات
ہندوستان میں کوروناکے 3.29 لاکھ سے زائد نئے کیسز ، 3876 اموات نئی دہلی ،11؍مئی (آئی این ایس انڈیا) ہندوستان میں یومیہ کورونا کیسز کی تعداد میں منگل کو کمی واقع ہوئی ہے اور ایک دن میں کورونا کے 3.29 لاکھ کیسزرپورٹ ہوئے ہیں۔ اس کے ساتھ ہی ملک میں کورونا کے کل کیسزبڑھ کر 22992517 ہو گئے۔ وزارت صحت کے اعداد و شمار کے مطابق گذشتہ 24 گھنٹوں کے دوران کورونا کے 329942 کیسزرپورٹ ہوئے جبکہ مزید 3,876فراد…
View On WordPress
0 notes
Text
ہندوستان میں کورونا کے 368147 نئے کیسز ، 3417 اموات
ہندوستان میں کورونا کے 368147 نئے کیسز ، 3417 اموات
ہندوستان میں کورونا کے 368147 نئے کیسز ، 3417 اموات نئی دہلی،03؍ مئی (آئی این ایس انڈیا) ملک میں کورونا کا قہرمسلسل جاری ہے پیر کو ایک بار پھر ملک میں ساڑھے تین لاکھ سے زیادہ کیسزدرج ہوئے۔ وزارت صحت کے جاری کردہ اعداد و شمار کے مطابق گذشتہ 24 گھنٹوں کے دوران ملک میں 368147 نئے کیسز رپورٹ ہوئے ، جس کے بعد متاثرہ افراد کی کل تعداد بڑھ کر 19925604 ہوگئی۔ جبکہ اس دوران 3417 مریضوں کی موت کے بعدمرنے…
View On WordPress
0 notes
Text
ہندوستان میں کورونا وائرس کے نئے کیسز میں73 فیصد کیسز 10 ریاستوں سے ہیں
ہندوستان میں کورونا وائرس کے نئے کیسز میں73 فیصد کیسز 10 ریاستوں سے ہیں
ہندوستان میں کورونا وائرس کے نئے کیسز میں73 فیصد کیسز 10 ریاستوں سے ہیں نئی دہلی،30؍ اپریل (آئی این ایس انڈیا) ملک میں کورونا کے ایک دن میں درج ہوئے نئے کیسزمیں سے 73.05 فیصد مہاراشٹر ، اترپردیش اور دہلی سمیت 10 ریاستوں میں رپورٹ ہوئے ہیں۔ جمعہ کو مرکزی وزارت صحت نے کہا ہے کہ گزشتہ چوبیس گھنٹوں کے دوران ملک میں انفیکشن کے 3,86,452نئے کیسزرپورٹ ہوئے ہیں ، جو ابھی تک کے نمایاں کیسز ہیں۔ اس کے ساتھ…
View On WordPress
0 notes
Text
امریکہ: نوول کروناوائرس کے نئے کیسز میں ڈیلٹا قسم 93فیصد سے زائد
امریکہ: نوول کروناوائرس کے نئے کیسز میں ڈیلٹا قسم 93فیصد سے زائد
امریکہ: نوول کروناوائرس کے نئے کیسز میں ڈیلٹا قسم 93فیصد سے زائد واشنگٹن،06؍اگست (آئی این ایس انڈیا) امریکہ میں جولائی کے آخری 2ہفتوں میں نوول کروناوائرس کے تمام نئے کیسز میں سے ڈیلٹا قسم کاتخمینہ 93.4فیصد لگایا گیا ہے۔امراض پر قابو پانے اور روک تھام کے امریکی ادارے نے کہا ہے کہ 31جولائی کو ختم ہونے والے ہفتہ کیلئے تازہ اعدادوشمار کے مطابق ملک کے کچھ علاقوں میں یہ تعداد اس سے بھی زیادہ…
View On WordPress
0 notes
Text
اکھلیش کے ڈریم پروجیکٹ گومتی ریور فرنٹ کیس میں سی بی آئی نے درج کیا نیا کیس یوپی میں 40مقاماتپرچھاپہ
اکھلیش کے ڈریم پروجیکٹ گومتی ریور فرنٹ کیس میں سی بی آئی نے درج کیا نیا کیس یوپی میں 40مقاماتپرچھاپہ
اکھلیش کے ڈریم پروجیکٹ گومتی ریور فرنٹ کیس میں سی بی آئی نے درج ��یا نیا کیس یوپی میں 40مقاماتپرچھاپہ لکھنؤ،05؍جولائی (آئی این ایس انڈیا) یوپی کے سابق وزیر اعلی اکھلیش یادو کے دور میں گومتی ندی منصوبے میں مبینہ بے ضابطگیوں کی تحقیقات کے لئے سی بی آئی نے ایک نیا مقدمہ درج کیا ہے۔ یوپی میں40 ، راجستھان اور مغربی بنگال میں ایک ایک سمیت 42 مقامات پر تلاش جاری ہے۔ گومتی ندی منصوبہ معاملہ میں سی…
View On WordPress
0 notes
Text
کورونا کے سب سے کم 60471 نئے کیسز ، 2726 اموات
کورونا کے سب سے کم 60471 نئے کیسز ، 2726 اموات
کورونا کے سب سے کم 60471 نئے کیسز ، 2726 اموات نئی دہلی،15؍ جون (الہلال میڈیا) 15 جون 2021 بروز منگل کی صبح تک ہندوستان میں گذشتہ 24 گھنٹوں میں 60471 نئے کورونا کیسز درج کیے گئے ہیں۔ اسی دوران 2726 افراد ہلاک ہوئے ہیں۔ گزشتہ کئی ہفتوں سے ہندوستان میں کورونا کے معاملات میں مستقل کمی واقع ہوئی ہے۔ دوسری لہر یعنی مئی کے آغاز میں یومیہ کیسز 4 لاکھ کو عبور کرچکے تھے ، جو اب 60000 کے قریب پہنچ گئے…
View On WordPress
0 notes